« 2005年6月 | メイン | 2005年8月 »

ハービー,サイコー!

2005年7月31日 / Diary

ハービー
映画の無料チケットの期限が切れそうだったので,ハービーを見に行ってきました.

ハービー~機械じかけのキューピッド~

主演がLindsay Lohan[IMDb]で,ディズニー映画.見ないわけにはいきません.あ,くりぃむしちゅーがCMをやっていることは,割とどうでも良いことです(^^;.


XML::RSSのインストールでエラーが発生

2005年7月30日 /

XML-RSS-1.05をインストールしようとすると,make testで,

not well-formed (invalid token) at line 36, column 9, byte 1125 at /usr/lib/perl5/vendor_perl/5.8.6/i386-linux-thread-multi/XML/Parser.pm line 187

というエラーが発生.

原因は,テスト用に生成されるRSS(2.0)中のpubDateがRFC822に準拠していないためだ(RFC 822の「5. DATE AND TIME SPECIFICATION」参照).


人間マウスCM(動画)

2005年7月29日 / Clipping

説明不要.リンク先サイトにあるwmvファイル(overworked.wmv)を見れば分かります.笑える.

Fight the Windmill: Overworked


Amazonマーケットプレイスにはまる

2005年7月28日 / Diary

ふとしたことから始めたAmazonマーケットプレイスにはまっています.

今までヤフオクで購入したことはあっても,出品は写真撮ったり,配送手続きするのが面倒そうだったので敬遠してきましたが,Amazonマーケットプレイスはうまくシステム化されていることもあって,楽しく出品できます.


サーバ復旧

2005年7月23日 / Server

サーバが故障していたのですが,ようやく復旧しました.ご迷惑をかけてすみません.

先週,家を開けている間に,HDDが壊れてしまいました.HDDの再セットアップだけなら楽なのですが,ついでにマシンを自作することにしたことから,大変なことに…


テス

2005年7月22日 / Diary

テスト

SOUND, MUSIC AND TEXUAL ASSOCIATIONS ON THE WORLD WIDE WEB

2005年7月12日 / DataMining

SOUND, MUSIC AND TEXUAL ASSOCIATIONS ON THE WORLD WIDE WEB[PDF]

Ian Knopke

楽曲データへの自動アノテーションを目指した,Web上にある楽曲データとWebテキストの関連づけに関する研究.楽曲のファイル名とそのファイルへのアンカーテキスト,あるいはその周辺テキストとの類似度を比較したところ.TF/IDF-Cos方式がまあまあ高い類似度を示した,つまり,サイトとそのリンク先にある楽曲ファイルは関連があるということが分かった(ある意味,当然ではあるけど).今後はサイト分析による自動アノテーションや,Topic focused crawlingにおける楽曲の取得判断に適用する方向に向かうものと思われる.

コミュニケーションの難しさ

/ Diary

今日は,コミュニケーションの難しさを感じた1日でした.

お互い理解し合えてなくて,良かれと思ってお願いしたことが実は逆効果だったとか,方向性が一致してないとか.まあ,今までそういうことを含めたぶっちゃけ話がなかなかできなかったことに問題があったわけだから,それが分かっただけでも良かったのかも知れない.


好みの計量研究会に参加

2005年7月11日 / DataMining

Survey MLで紹介されていた好みの計量研究会に参加してきました.

<平成17年度:第4回好みの計量研究会(公開研究会)> 日時:7月8日(金)18:00会場 18:30〜21:00 場所:東京大学 駒場12号館1階1213教室 参加費:1000円 学生500円 (会員外の参加者には、人数制限があります。) 主催:好みの計量研究会 http://www.mayomi.org/research01/konomi/konomi.html

内容:

1.松尾豊さん(産業技術総合研究所)18:30-19:50(御発表・質疑含む)

演題「Webからの高次情報のマイニング」

要旨:

近年、Web上では、BlogやSNSをはじめとして、ますます多くの人々の個々の活動の情報が得られるようになっている。我々はWeb上の膨大な情報から、検索エンジンやテキスト処理を使って情報を集約し、高次の情報を抽出する研究を行っている。本発表では、人や組織のネットワークやキーワードを抽出する研究、特に、Web上の情報から研究者ネットワークを得る手法について紹介する。

2.内山幸樹さん(株式会社ホットリンク)20:00-21:00(御発表・質疑含む)

演題「blog マイニングサービスの事業化」

要旨:

ホットリンクは、東京工業大学の奥村先生の研究成果であるblogWatcherの事業化活動を行っている。現在、ソフトバンクBB 社をファーストユーザとして、その事業化への活動を進めているが、その過程を紹介しながら、「blogWatcher の実際のビジネス適用への一次結果」・「Webからの高次情報のマイニングに対する市場のニーズ・可能性・課題」・「研究成果から製品までの壁」・「産学連携のあり方」に関して発表する。


Webalizerを導入

2005年7月10日 / Server

自宅サーバを立ち上げてから1週間,そろそろapacheのaccess_logを見るのも飽きてきたので,ちゃんとしたWebアクセスログ解析ツールを導入することにした.

analogWebalizerが有名なようだけど,設定が分かりやすそうなWebalizerをチョイス.

導入には,Apacheアクセスログ解析(Webalizer) - Fedoraで自宅サーバー構築が参考になる.

cssやswfへのアクセスと,自分からのアクセスは除外したいので/etc/webalizer.confに以下を追加

HostName www.plus-add.com

IgnoreSite 192.168.0.*

HideURL *.css

HideURL *.swf

monthsはマンツ

/ English

「month」の複数形である「months」を「マンスス」と発音していた人は要チェック.