機械学習

カーネル

PRML は会社の若い人たちとほそぼそと読んでます.上巻がおわって下巻の最初の章が終わって,次からようやくSVMに入るところです.どうもカーネル法がわかったようなわからないような微妙な感じが残ったので,ちまたのPRML読書会系ブログを参考にさせていた…

Star Clustering

というので遊んでみました(これは趣味半分、本職半分なんですが)。何をやっているか直感的にわかりやすいので、自分にとっては面白いです。とりいそぎ Ruby の実装したのですが、ノード数 n に対して類似度行列を作るのに O(n^2)の計算量が必要なので、か…

Google Sets より高精度な SEAL の中身

先日書いたSEALの話題のつづきです。論文のPDF が公開されていましたので、ダウンロードしてみました。まだすべてを読み切れていないのですが、射撃しつつ前転さんのブログで解説されていましたので、ズルをしてそちらを先に拝見してしまいました。ブログ記…

Google setsより高精度な SEAL

「理系大学院留学日記」でご紹介されているのをみて知ったのですが、Google setsと同様なことを実現するSEAL (Set Expander for Any Language) という技術が公開されています。まだ論文は未公開なようなのですが、どのような手法を使っているのかとても興味…

IMDbデータいじり

時間をみつけて色々遊びはじめてます。まずはデータの正規化というか、無駄な情報の刈り込みをしているところですが、ちょっとしたことをやるだけでも色々と興味深いデータが出てきて面白いです。ちなみに「市民ケーン」につけられたキーワードの内、トップ1…

Bayesian sets つづき

先日来作っていたものを下記で公開してみました。よろしければお使いください。 Bayesian Sets with MovieLens Data 関連記事: http://d.hatena.ne.jp/valdzone/20070713#1184355825 http://d.hatena.ne.jp/valdzone/20070708#1183923567 http://d.hatena.ne…

bayesian sets のメモ

関連記事 http://d.hatena.ne.jp/valdzone/20070708#1183923567 http://d.hatena.ne.jp/valdzone/20070702#1183424810以下は自分用の備忘録です。解説というにははしょり過ぎだし、わかっている人には自明すぎでしょうもないものです。 Bayesian Sets がやっ…

Bayesian sets で映画マイニング

少し前にここやここやここをみて、Bayesian Sets にとても興味を持ったので、元論文を追いかけつつ、例によって Ruby でお手軽に実装してみました。ここでも使われている Movie Lens のデータセットをありがたく使わせて頂き、元論文と同じような条件でデー…