ruby

gtalk bot で翻訳

英語と日本語どっちでも入力できるようにしておくともうちょっと便利になります。webster よりも良いのは、単語の訳だけでなくて翻訳もできること。かな。 #!/usr/bin/env ruby require 'xmpp4r/Client' include Jabber class GtalkClient def initialize(ji…

xmpp4r + google talk bot (en2ja/ja2en) で webster もどき

最近 gtalk translator bot を使って辞書を引く回数が増えてきたのですが、Mac OSXでは専用のクライアントがないのでウェブインタフェースを使っているのですが、ポップアップしたウィンドウがすぐにどこかに行ってしまいイライラすることが多いので、ターミ…

はじめてのRAA

まだ色々と改良の余地はあるのだけど拙速は巧遅に優るということにして登録してみた。ドキュメントとか説明をもう少し真面目に書かないと、既存のライブラリとの差がよくわからないので無駄になってしまうなぁ(従来の実装と比較して400倍の性能という宣伝文…

Bloom Filter 実装の高速化

前回まで http://d.hatena.ne.jp/valdzone/20070625#1182768956 http://d.hatena.ne.jp/valdzone/20070624#1182681301どうにもこうにもBloomFilter が遅いので、Cによる拡張ライブラリを作ってみた。ソースコードはこちらより(完全無保証です)。 思ってい…

hash vs. bloomfilter その2

当面はメモリを沢山積んだマシンでどうにかなってしまったのだけど、今後の事も考えてちょっとだけ深追いする事にした。まず、既エントリーのキーであるかを参照するところがボトルネックであるようなので、とりいそぎハッシュ関数を疑ってみる。案の定 SHA1…

hash vs. bloomfilter

最近仕事でも ruby をぼちぼちと使い始めているのだけど、お手軽に結果をみているフェーズでは良いとして、大規模なデータを扱うようになるとどうしても速度とメモリの問題にぶつかってしまう。これは perl などの他のLLを使ってももちろん同じで、C だとし…