20071101

大規模日本語n-gramデータ

『大規模日本語n-gramデータの公開』(Google Japan Blog)，このたび、Web から抽出した約200億文（約2550億単語）の日本語データから作成したn-gramデータ(1〜7 gram)を公開致しました。データの配布にあたっては特定非営利活動法人言語資源協会(以下、GSK)の言語資源流通サービスを利用させて頂いており、団体・個人の区別なく御利用頂けます。

どう書く？org

『どう書く？org』，「どう書く？org」へようこそ！このサイトは出されたお題をいかに解くか競い合う、プログラマのためのコロシアムです。面白そうだ…

Book & Comic

書類を郵送しに行ったついでに図書館に本を返却し，『真理と解釈』(Davidson, D. 野本和幸・金子洋之・植木哲也・高橋要[訳]. 勁草書房, 1991)を借りてきた．さらに書店に行って，『サイバラ茸 (7)』(西原理恵子. 講談社, 2007)を購入した…

DoCoMoの迷惑メイル対策

『ドコモが今日からSender-ID/SPFでメールを受信拒否する設定を始めたけど、From:とenvelope-from:の解釈がRFCと違ってまぜこぜ？』(void GraphicWizardsLair( void ); //)，ドコモにメール送る時は送信メールサーバーのIPアドレスをSPFレコードとしてDNSに登録するFrom:に書くアドレスは、SPFレコードを設定した自社ドメインしか使わないどうしても違うFrom:アドレスを使いたい時は、MTAでFrom:を削除してenvelope-from:でSPFをチェックさせないとドコモは受け取ってくれないよ（ひでぇ！）……という解釈なんだけど。最後の項目はけっこう泣ける人もいるんじゃないかなぁ。DoCoMoの携帯電話宛で無くても，(MTAではなく)MUAで"From:“フィールドを消す人1が出てきそうだ… ...