Bayesian sets つづき

先日来作っていたものを下記で公開してみました。よろしければお使いください。
Bayesian Sets with MovieLens Data
関連記事:

アルゴリズムそのものは実装が終わっていたのですが、CGI化するにあたって、入力クエリを既にある集合から選択するようにするのがわりと面倒でした。速度はCGIが呼び出されるたびに行列データを読み込んだりしているので、やや遅いです。が、耐えられないほどでもないのでCで拡張ライブラリを作るのはもう少し様子をみてからにしようと思います。さらに高速化を目指すのならCGIをやめて、「C++と Pthreads でミニマルなHTTPサーバを書く」「AjaxIMEのHTTPサーバは pre-pthread」で紹介されている自前のhttpサーバを作るノウハウがとても役に立ちそうです。もちろんレンタルサーバ上でやるのは無理そうですが(自宅サーバか専用サーバか)。あと入力のインタフェースはもうちょっと工夫の余地があるかなと思います。出力結果に色をつけたり、どこかのAPIからひっぱってきた画像をつけたりするともうちょっと見栄えが楽しくなるかもしれません。色々とクエリを入れて試しているうちにどうも投票したユーザの年齢要素が結果に大きな影響を及ぼしている気がしてきたので、そのうち調べてみようと思っています。また、MovieLens データは2001年以降の映画が含まれないのがとても残念なのですが、他にも色々面白そうなデータを探してきて試してみれればと考えています。
このように不格好ながらも実際に動くものを作ってみると色々と今まであまり考えてなかった事がわかったり、ちょっとしたアイディアが出てくるのが面白いです。論文読んだだけではわからなかったことも発見できました。お手軽に試してみれるというのはとても大事ですね。

ハリー・ポッターと不死鳥の騎士団

昨日ここのマディソン支店(?)で見てきました。さすがにWikipediaで予習してかつ事前にすべてのシリーズを読破しているというハリポタマニアの友人に講習を受けただけあって、字幕なしでもよくわかりました。それでも1割くらいわからない箇所がありましたが。案の定小さな子供が多くて騒々しかったですが、それはそれで色々と勉強になって面白かったです。ちなみにここのシネコンでは聴覚障害者や外国人のために字幕付きで映画を放映しているスクリーンが1つあるので、今後はそこでみるという手もあるようです。
元々シリーズ全作のなかで最長の巻なだけあって、物語が複雑で色々なテーマ(そのうちのひとつはメディアと政治)がちりばめられているようです。しかし映画の中では多くの部分がカットされていたようで、映画を見終わった後に友人による解説を聞いてなるほどと思うようなこともありました(その内容を書くと核心に触れてしまうので割愛しますが)。これまであまり意識してなかったですが、イギリスの学校の寄宿舎(boarding school)文化における様々な伝統や家柄による差別という観点で見ても面白いようです。今手を出すとはまりそうですが、いずれ原作を読んでみたいです。

マディソン アート・フェア

がキャピトルスクエアで開催してました。
http://www.artcraftwis.org/afos.html

たくさんの出展者が全国から集まっていました。とてもすべては見切れなかったのですが、下記の作品が面白かったです。
http://www.zachmann.com/
http://www.whitphoto.com/
後者は写真なのですが、水滴に映った風景という構図がとても面白いです。どんなレンズを使えばあのような写真がとれるのか・・・