大規模日本語n-gramデータ

『大規模日本語n-gramデータの公開』(Google Japan Blog),このたび、Web から抽出した約200億文(約2550億単語)の日本語データから作成したn-gramデータ(1〜7 gram)を公開致しました。データの配布にあたっては特定非営利活動法人 言語資源協会(以下、GSK)の言語資源流通サービスを利用させて頂いており、団体・個人の区別なく御利用頂けます。

2007-11-01 · Ryusuke KIKUCHI <ryusuke.kikuchi@gmail.com>

どう書く?org

『どう書く?org』,「どう書く?org」へようこそ! このサイトは出されたお題をいかに解くか競い合う、 プログラマのためのコロシアムです。面白そうだ…

2007-11-01 · Ryusuke KIKUCHI <ryusuke.kikuchi@gmail.com>

Book & Comic

書類を郵送しに行ったついでに図書館に本を返却し,『真理と解釈』(Davidson, D. 野本 和幸・金子 洋之・植木 哲也・高橋 要[訳]. 勁草書房, 1991)を借りてきた. さらに書店に行って,『サイバラ茸 (7)』(西原 理恵子. 講談社, 2007)を購入した…

2007-11-01 · Ryusuke KIKUCHI <ryusuke.kikuchi@gmail.com>

DoCoMoの迷惑メイル対策

『ドコモが今日からSender-ID/SPFでメールを受信拒否する設定を始めたけど、From:とenvelope-from:の解釈がRFCと違ってまぜこぜ?』(void GraphicWizardsLair( void ); //),ドコモにメール送る時は 送信メールサーバーのIPアドレスをSPFレコードとしてDNSに登録するFrom:に書くアドレスは、SPFレコードを設定した自社ドメインしか使わないどうしても違うFrom:アドレスを使いたい時は、MTAでFrom:を削除してenvelope-from:でSPFをチェックさせないとドコモは受け取ってくれないよ(ひでぇ!)……という解釈なんだけど。最後の項目はけっこう泣ける人もいるんじゃないかなぁ。DoCoMoの携帯電話宛で無くても,(MTAではなく)MUAで"From:“フィールドを消す人1が出てきそうだ… ...

2007-11-01 · Ryusuke KIKUCHI <ryusuke.kikuchi@gmail.com>

CAPTCHA破り

『Yahoo!アカウントを不正取得する「ストリップゲーム」出現』(ITpro),今回の悪意のあるプログラムは、米Yahoo!のユーザーアカウントを不正に取得しようとする。プログラム作者のコンピューターは、Yahoo!のユーザー登録画面にアクセスし、画像認証用の文字列画像を取得。その画像を「ストリップゲーム」に送信し、ゲームのユーザーに解読させる。CAPTCHAはその名1のとおりTuring testなんだから,人間に解かせてしまえってわけか… Completely Automated Public Turing test to tell Computers and Humans Apart ↩︎ ...

2007-10-30 · Ryusuke KIKUCHI <ryusuke.kikuchi@gmail.com>