大規模日本語n-gramデータ
『大規模日本語n-gramデータの公開』(Google Japan Blog),このたび、Web から抽出した約200億文(約2550億単語)の日本語データから作成したn-gramデータ(1〜7 gram)を公開致しました。データの配布にあたっては特定非営利活動法人 言語資源協会(以下、GSK)の言語資源流通サービスを利用させて頂いており、団体・個人の区別なく御利用頂けます。
『大規模日本語n-gramデータの公開』(Google Japan Blog),このたび、Web から抽出した約200億文(約2550億単語)の日本語データから作成したn-gramデータ(1〜7 gram)を公開致しました。データの配布にあたっては特定非営利活動法人 言語資源協会(以下、GSK)の言語資源流通サービスを利用させて頂いており、団体・個人の区別なく御利用頂けます。
『どう書く?org』,「どう書く?org」へようこそ! このサイトは出されたお題をいかに解くか競い合う、 プログラマのためのコロシアムです。面白そうだ…
書類を郵送しに行ったついでに図書館に本を返却し,『真理と解釈』(Davidson, D. 野本 和幸・金子 洋之・植木 哲也・高橋 要[訳]. 勁草書房, 1991)を借りてきた. さらに書店に行って,『サイバラ茸 (7)』(西原 理恵子. 講談社, 2007)を購入した…
『ドコモが今日からSender-ID/SPFでメールを受信拒否する設定を始めたけど、From:とenvelope-from:の解釈がRFCと違ってまぜこぜ?』(void GraphicWizardsLair( void ); //),ドコモにメール送る時は 送信メールサーバーのIPアドレスをSPFレコードとしてDNSに登録するFrom:に書くアドレスは、SPFレコードを設定した自社ドメインしか使わないどうしても違うFrom:アドレスを使いたい時は、MTAでFrom:を削除してenvelope-from:でSPFをチェックさせないとドコモは受け取ってくれないよ(ひでぇ!)……という解釈なんだけど。最後の項目はけっこう泣ける人もいるんじゃないかなぁ。DoCoMoの携帯電話宛で無くても,(MTAではなく)MUAで"From:“フィールドを消す人1が出てきそうだ… ...