SOUND, MUSIC AND TEXUAL ASSOCIATIONS ON THE WORLD WIDE WEB

2005年7月12日 / DataMining

SOUND, MUSIC AND TEXUAL ASSOCIATIONS ON THE WORLD WIDE WEB[PDF]

Ian Knopke

楽曲データへの自動アノテーションを目指した,Web上にある楽曲データとWebテキストの関連づけに関する研究.楽曲のファイル名とそのファイルへのアンカーテキスト,あるいはその周辺テキストとの類似度を比較したところ.TF/IDF-Cos方式がまあまあ高い類似度を示した,つまり,サイトとそのリンク先にある楽曲ファイルは関連があるということが分かった(ある意味,当然ではあるけど).今後はサイト分析による自動アノテーションや,Topic focused crawlingにおける楽曲の取得判断に適用する方向に向かうものと思われる.

好みの計量研究会に参加

2005年7月11日 / DataMining

Survey MLで紹介されていた好みの計量研究会に参加してきました.

<平成17年度:第4回好みの計量研究会(公開研究会)> 日時:7月8日(金)18:00会場 18:30〜21:00 場所:東京大学 駒場12号館1階1213教室 参加費:1000円 学生500円 (会員外の参加者には、人数制限があります。) 主催:好みの計量研究会 http://www.mayomi.org/research01/konomi/konomi.html

内容:

1.松尾豊さん(産業技術総合研究所)18:30-19:50(御発表・質疑含む)

演題「Webからの高次情報のマイニング」

要旨:

近年、Web上では、BlogやSNSをはじめとして、ますます多くの人々の個々の活動の情報が得られるようになっている。我々はWeb上の膨大な情報から、検索エンジンやテキスト処理を使って情報を集約し、高次の情報を抽出する研究を行っている。本発表では、人や組織のネットワークやキーワードを抽出する研究、特に、Web上の情報から研究者ネットワークを得る手法について紹介する。

2.内山幸樹さん(株式会社ホットリンク)20:00-21:00(御発表・質疑含む)

演題「blog マイニングサービスの事業化」

要旨:

ホットリンクは、東京工業大学の奥村先生の研究成果であるblogWatcherの事業化活動を行っている。現在、ソフトバンクBB 社をファーストユーザとして、その事業化への活動を進めているが、その過程を紹介しながら、「blogWatcher の実際のビジネス適用への一次結果」・「Webからの高次情報のマイニングに対する市場のニーズ・可能性・課題」・「研究成果から製品までの壁」・「産学連携のあり方」に関して発表する。