画像あそび


画像のおあそび。近頃は肝心の機械学習そのものはさておいて、UI まわりでなんかおもしろいことないかなぁと思い、フリーのフラッシュのライブラリである ming で使って遊んでいた。また、手持ちの画像データには限界があるので、Flickrcreative commons license になっているすばらしい画像データを利用させて頂く事にした。ruby を使いたいという要求があったので、ming/ruby と、rmagick を使う事にした。ming/ruby についてはここここの解説が大変参考になった。Flickr の API をたたいてあそぶうえで、ここは大変参考になった。APIruby から使うには既に色々でている wrapper を使ってもいいのだけど、いずれも機能が山盛りなので、自分がやりたいことを実装するには自前でつくってしまった方が楽なようだ。それにしても rexml をはじめ、各種ライブラリを使うとプログラミングがとても楽なのに今さらながら感じ入ってしまった。

まとめると、

をつかって何かをしようということなのだけど、昔からよくあるやつで、テキストを入れると自動的にバナーを作成するアレをつくってみることにした。その上で、ここでみつけた Flickroneletter 等のグループに属する画像を使ってみる事にした。とりいそぎの目標は

  • テキストを入れると Flickr の画像をつかってロゴを作成する
  • ロゴはフラッシュでできている
  • フラッシュを使うので、動画GIF や Ajax よりは気の利いた感じのアニメーションをつける(rmagick の効果をいかす)

ということにした。とりいそぎ手元のMacOSXで動くようになったで、結果のみ公開しておこう。近日中にソースをつけてCGI から使えるようしようと思う。いまのところ、画像にしたい文字列をアルファベットでいれるとフラッシュのファイルができるというのを以下のようなコマンドで実現している。
% ruby title2flash.rb valdzone
フラッシュ中の画像をクリックすると取得したFlickr のページが表示される(はず)。

Frickr API がお手軽に使えることがわかったので、つぎは Flickr から色の分析に使う画像を集めようと思う。それにしてもこれだけ規模のでかいレポジトリで、しかも Folksonomy 的とはいえラベル付きのデータが無料で手に入れられるというのは太っ腹としかいいようがない。それもこれも CC ですばらしい画像を提供してくださるみなさんのおかげ。他の分野でもこのようなライセンスでどんどんデータが提供されるようにできればよいのだけど。
ところで画像を色で分類するというネタは下記などで既にやられていることが判明。Flickr の画像を使っているようだけど、API から取得できる画像情報には色情報までは含まれていないので、自前のデータベースに分析結果を保持しているのだろう。
http://www.krazydad.com/colrpickr/index.php?group=flowers