p2pを加速する新技術SET

現状のp2pでは初めてシードされたファイルある場合やピア数が少ない場合スピードがダウンするほか、交換し合うファイル内容がすこしでも違うとリソースとして使われることはない。カーネギーメロン大学、パーデュー大学とインテルのチームの研究による新技術SETはp2pにおけるファイルの相似性に注目し、handprintingという方法で自分がダウンロードしているファイルと似たファイルを探し出す。音楽ファイルであればタグ、映画トレイラーであれば使用言語などの違いを吸収する結果、リソースが増えることからダウンロードの加速につながることになる。SET研究開発チームは実際のコードを公開しているのでSETがp2pに取り入れられる日も近いと思われる。

The "Similarity" portion of SET comes from the realization that many of the files being shared contain pieces of identical data. Examples include music files that differ only in terms of tags, movies or movie trailers that are dubbed in different languages, and updated versions of software. Like other P2P systems, SET divides large files into small segments. Once that process is complete, however, the SET software searches for similar files using a method called "handprinting," which is similar to the pattern matching techniques used to cluster search results or filter spam. Once similar files are identified, they are scanned for any individual chunks that are identical to pieces of the file being downloaded.

http://arstechnica.com/news.ars/post/20070410-accelerated-p2p-by-similarity-searches.html
http://arstechnica.com/news.ars/post/20070411-inside-the-set-p2p-system.html