googleとyahooのクローラーがflash内容を読み取り可能に

googleとyahooのクローラーflash内容を読み取りインデックス化し検索結果に反映できるようになる。これまでflashサイトでは静的テキストとリンクだけは読み取ることができたがflashそのものの内容を読み取ることは不可能だったのでウェブ・ユーザビリティーの点で問題があった。例えばflashを多用する宝石商のティファニーのサイトでは現在大多数のサイト内容がクローラーで読み取れないためgoogleの検索結果中にも現れない。試しにgoogleTiffany gold ringを検索してみると一番に来るのがoverstockjeweler.comであってティファニー自身のサイトではない。このことから言って今回のクローラーflash対応化で最大に得するのがこうしたflashを使っているが検索ランキングには悪影響を与えたくないサイトであるのは間違いない。googleはすでに検索の調整を始めており,yahooも後に続く予定。

Previously, search engines indexed the "static" text and links on a site, falling far short of capturing all the content. "It's like reading the index of a book, rather than the book itself," says Justin Everett-Church, a senior product manager for Flash. Now, Google and Yahoo will read the whole darn book ― namely, they'll use web crawlers to play through all of a Flash website's possible "states," and make that content available through their search results. The previous "invisibility" of much Flash content to search engines has been a complaint from Flash developers and site owners, Everett-Church says.

http://venturebeat.com/2008/06/30/new-deal-makes-invisible-flash-content-visible-to-search/

We've developed an algorithm that explores Flash files in the same way that a person would, by clicking buttons, entering input, and so on. Our algorithm remembers all of the text that it encounters along the way, and that content is then available to be indexed. We can't tell you all of the proprietary details, but we can tell you that the algorithm's effectiveness was improved by utilizing Adobe's new Searchable SWF library.

http://googlewebmastercentral.blogspot.com/2008/06/improved-flash-indexing.html