唐突に

画像を機械学習的に分類する遊びを始めた。まずは pnm とかわかりやすそうなフォーマットから入ってもいいのだけど、いずれデジカメ写真とかをターゲットにしようと思っているので、最初から jpeg を対象にしようと思う。jpeg フォーマットはかなり複雑なのでライブラリの手助けを借りないと厳しい。EXIF 周りとかもわりと細々とあって奥が深い。いずれにしてもスクラッチから jpeg を解析するプログラムを作るのはかなり骨が折れそうなので、libjpeg を使う事にした。とりあえず C を使って遊んでいる。 余裕があれば jpeg 圧縮データを自前の逆離散コサイン変換のプログラムで本当に伸張できるかを試してみたいと思う。お手軽に画面表示したりしてみたいので、ruby のライブラリがあればとても便利だと思う。Ruby/GD がそれなのかな。
それで色の情報を取り出す事はできたのだけど、あとは特徴量を適度な大きさのベクトルで定義するのに色情報のサンプリングと量子化が必要なのだけど、どのようなサイズをどのような範囲で区切れば妥当なのかがよくわからない。このあたり色々試行錯誤しながらやってみよう。