好みの計量研究会に参加
Survey MLで紹介されていた好みの計量研究会に参加してきました.
<平成17年度:第4回好みの計量研究会(公開研究会)> 日時:7月8日(金)18:00会場 18:30〜21:00 場所:東京大学 駒場12号館1階1213教室 参加費:1000円 学生500円 (会員外の参加者には、人数制限があります。) 主催:好みの計量研究会 http://www.mayomi.org/research01/konomi/konomi.html内容:
1.松尾豊さん(産業技術総合研究所)18:30-19:50(御発表・質疑含む)
演題「Webからの高次情報のマイニング」
要旨:
近年、Web上では、BlogやSNSをはじめとして、ますます多くの人々の個々の活動の情報が得られるようになっている。我々はWeb上の膨大な情報から、検索エンジンやテキスト処理を使って情報を集約し、高次の情報を抽出する研究を行っている。本発表では、人や組織のネットワークやキーワードを抽出する研究、特に、Web上の情報から研究者ネットワークを得る手法について紹介する。2.内山幸樹さん(株式会社ホットリンク)20:00-21:00(御発表・質疑含む)
演題「blog マイニングサービスの事業化」
要旨:
ホットリンクは、東京工業大学の奥村先生の研究成果であるblogWatcherの事業化活動を行っている。現在、ソフトバンクBB 社をファーストユーザとして、その事業化への活動を進めているが、その過程を紹介しながら、「blogWatcher の実際のビジネス適用への一次結果」・「Webからの高次情報のマイニングに対する市場のニーズ・可能性・課題」・「研究成果から製品までの壁」・「産学連携のあり方」に関して発表する。
松尾氏の「Webからの高次情報のマイニング」の方は,Googleの検索結果から研究者同士の関連度を計算し,それを元に研究者同士の繋がりや新しい関係を発見しようという試み.一見シンプルに見える手法(2人の研究者の出現確率(共起)を利用)ながらも,そこそこ精度の高い結果が得られていたのが興味深かった.Bag of Wordsなアプローチでもうまくいっているのは,研究者の名前に表記の揺れが少ないこと,論文の著者名の出現する文の構造がシンプル,といったように,手法と対象データの相性の良さが大きいことに理由があるように思いました.これが例えば,芸能人やモヒカン族の繋がりだったりすると,うまくいくのかどうかは謎.あと,この分野の研究ではGoogle-DFという,あるキーワードでググッた時の検索結果数(=Document Frequency)が普通に用いられているらしい.Google,恐るべし.
内山氏の「blog マイニングサービスの事業化」の方は,ホットリンク社の紹介がメイン.「今までは農業と工業の時代,これからは脳業の時代」という話にはとても共感できた.僕自身もそういう思いで今の仕事に取り組んでいて,これからはモノから知識や知恵の時代だと思っているからだ.また,ホットラボという,企業と大学が共同で研究からビジネスの立ち上げを行う取り組みの紹介もあった.どうすればGoogleのように知識処理技術をビジネスに昇華することができるか?ということを日頃考える中で,トライ&エラーで実践的にやっていくことが重要だと思っているので,こういう試みからGoogleを越える何かが出てきて欲しいと思います.
トラックバック
このエントリーのトラックバックURL:

