『大規模日本語n-gramデータの公開』(Google Japan Blog),
このたび、Web から抽出した約200億文(約2550億単語)の日本語データから作成したn-gramデータ(1〜7 gram)を公開致しました。データの配布にあたっては特定非営利活動法人 言語資源協会(以下、GSK)の言語資源流通サービスを利用させて頂いており、団体・個人の区別なく御利用頂けます。
『大規模日本語n-gramデータの公開』(Google Japan Blog),
このたび、Web から抽出した約200億文(約2550億単語)の日本語データから作成したn-gramデータ(1〜7 gram)を公開致しました。データの配布にあたっては特定非営利活動法人 言語資源協会(以下、GSK)の言語資源流通サービスを利用させて頂いており、団体・個人の区別なく御利用頂けます。