(Translated by https://www.hiragana.jp/)
言語資源コーパス「CD-毎日新聞記事データ集」 | 毎日新聞

コンテンツ販売:教育機関・自治体向けニュース・写真提供大学図書館、公共図書館などには毎日新聞のデータベースを定額でご利用いただけるサービスをご用意しています。言語処理のコーパス研究の分野ではスタンダードのデータ集も充実。法人向けのご利用もご相談に応じます。

CD-毎日新聞データ集

毎日新聞まいにちしんぶん紙面しめん掲載けいさいされた記事きじデータにタグをけ1ねんごとにCD(もしくは、DVD)に収録しゅうろく。コーパス研究けんきゅうふくめ、自然しぜん言語げんご処理しょり分野ぶんやではスタンダードな基礎きそデータになっています。
また、全国ぜんこく地方ちほうばん記事きじくわえた<CD-毎日新聞まいにちしんぶんデータしゅうプラス>も好評こうひょうです。

CD-毎日新聞まいにちしんぶんデータしゅう(タグき) 詳細はこちら
販売はんばい日外にちがいアソシエーツ(株)かぶしきがいしゃ

毎日新聞まいにちしんぶん記事きじデータ(csv形式けいしき) 詳細はこちら
販売はんばい日本にっぽんデータベース開発かいはつ(株)かぶしきがいしゃ

 
活用かつよう研究けんきゅう事例じれい
画像
CD毎日まいにちデータしゅうがどのように使つかわれているか、京都きょうと大学だいがく学術がくじゅつ情報じょうほうメディアセンターの河原かわはら達也たつや教授きょうじゅきました。
情報じょうほう検索けんさく機械きかい翻訳ほんやく音声おんせい認識にんしきなどの言語げんご処理しょり技術ぎじゅつ研究けんきゅうでスタンダードな基礎きそデータとなっている「CD-毎日新聞まいにちしんぶんデータしゅう」。膨大ぼうだい新聞しんぶん記事きじのデータが、全国ぜんこく大学だいがく研究けんきゅう機関きかん最先端さいせんたん研究けんきゅう素材そざいとして活用かつようされています。