風柳メモ

ソフトウェア・プログラミング関連の覚書が中心

ツイちぇき!を追跡 (tweetcheckit)がなぜ検索結果を独占するのか?

http://tweet.ocn.ne.jp/キーワードを10分毎につぶやくbot作ってあったのですが、

Twitter の検索結果に、ただキーワードを羅列しただけの tweetcheckit のつぶやきがたくさん流れて迷惑です。

http://d.hatena.ne.jp/furyu-tei/20100617/1276774750#c1277999471

というクレームがあったので、停止しました。

解説

迷惑と言われてまで継続したいbotでもないので停止しましたが、一応、弁解をしておくと。


多分、

のようになるのが迷惑、ということなのでしょうが、ちょっと待って下さいね。


tweetcheckit のつぶやき間隔は、たかだか約10分に6回(1〜30位を5個ずつにわけてつぶやいていたので、1キーワードに関しては10分に1回)です。


一方、キーワードは、ツイちぇき!の分析では『キーワード (1分あたりの頻度)』でツイートされているはずです。


つまり、例えば『口蹄疫 (22)』とかあったら、tweetcheckit のツイートとツイートの間には、22×10(実際にはその間も変動してますが)程度のツイートが本来はさまっていないとおかしいのです。
実際、例えば"iPhone"とか検索すると、tweetcheckitのツイートなんて誤差程度しか出てこないはずです。


早い話が、Twitter検索が本来はさまっているはずのツイートを(特に日本語の場合)うまく抽出出来ていない(一方、tweetcheckitはキーワード前後に半角スペースを挿んでいるため、比較的抽出されやすい)というのが現状であると、当方は考えています。
むしろtweetcheckitが多く表示されるキーワード程、Twitter検索ではうまく抽出出来ていないんだな、という目安になっていた気がしています。