(Translated by https://www.hiragana.jp/)
朝日新聞の校閲部門の蓄積×AIで精度の高い文章校正:朝日新聞GLOBE+
  1. HOME
  2. 朝日新聞あさひしんぶん校閲こうえつ部門ぶもん蓄積ちくせき×AIで精度せいどたか文章ぶんしょう校正こうせい

朝日新聞あさひしんぶん校閲こうえつ部門ぶもん蓄積ちくせき×AIで精度せいどたか文章ぶんしょう校正こうせい

Sponsored by 朝日新聞社あさひしんぶんしゃ 公開こうかい
「Typoless」開発かいはつしゃ倉井くらいたかしさん(写真しゃしんひだり)と校閲こうえつ記者きしゃ比留間ひるま直和なおかずさん

[ききて関根せきね かずひろし(GLOBE+編集へんしゅうちょう

40年間ねんかん膨大ぼうだい記事きじデータのほかに、校正こうせい履歴りれきデータを学習がくしゅうしたAI

――Typolessは、朝日新聞社あさひしんぶんしゃ校閲こうえつ部門ぶもん知見ちけんと、AIという最新さいしんのテクノロジーを結集けっしゅうした文章ぶんしょう校正こうせいAIですね。

倉井くらいたかし はい。Typolessは、AI、朝日新聞あさひしんぶん用語ようごのルール、そしてユーザーがわのカスタム辞書じしょ設定せっていできる構成こうせいになっています。

AIにはただしい日本語にほんごまなばせる必要ひつようがあるわけですが、朝日新聞社あさひしんぶんしゃには過去かこ40ねんぶん記事きじがデジタルされたものがあり、その膨大ぼうだい記事きじデータを学習がくしゅうさせました。

さらには、どういう文章ぶんしょうあやまりをどうなおしたのかという校正こうせい履歴りれきのデータがあります。完成かんせいした記事きじだけでなく、その校正こうせい編集へんしゅう履歴りれき学習がくしゅうさせることで、AIがあやまりの指摘してきをできるようになるのです。そのおかげで、校正こうせいとくした、精度せいどたかいAIになっています。

社内しゃないでは日々ひび記事きじ蓄積ちくせきされていくので、AIは定期ていきてきなアップデートのなかあたらしい用語ようごにも対応たいおうできるようになります。

また、朝日新聞あさひしんぶん使つかっているルールにもとづいた辞書じしょデータ、実際じっさい記者きしゃ使つかっている校正こうせい支援しえんシステムというものがあります。そのルール辞書じしょ搭載とうさいされていて、あやまりやすい日本語にほんご漢字かんじ慣用かんよう専門せんもん用語ようごなどやく10まん登録とうろくされています。

AIと朝日新聞あさひしんぶん辞書じしょ、2系統けいとうでチェックできるのがTypolessの特長とくちょうです。

Typolessの開発かいはつについて説明せつめいする倉井くらいさん

――さらにユーザーがわカスタマイズできるときました。

倉井くらい はい。Typolessはカスタム辞書じしょ設定せっていできます。会社かいしゃによって表記ひょうきのルールはちがいますよね。企業きぎょうごとの用語ようごしゅうおと引(おんび)きの有無うむやカタカナ表記ひょうきなどのルールをカスタム辞書じしょ設定せっていすれば、社内しゃない統一とういつした文書ぶんしょをつくることができます。(※カスタム辞書じしょはプレミアムコース以上いじょう機能きのうになります。)

――ユーザーが入力にゅうりょくした文章ぶんしょうもAI学習がくしゅう使つかわれるのですか?

倉井くらい いいえ、セキュリティーじょう、AIの学習がくしゅうにはもちいていません。入力にゅうりょくされた文章ぶんしょうはサーバーにのこらないように設計せっけいしていますので、そこは安心あんしんして使つかっていただければとおもいます。

――Typolessには朝日新聞あさひしんぶん校正こうせい支援しえんシステムや校閲こうえつ記者きしゃたちの知見ちけんまれているということですが、校閲こうえつ記者きしゃとはどんな仕事しごとなんでしょうか。

比留間ひるま直和なおかず 新聞しんぶんは「ファクト・事実じじつ」と「ろん」をつたえるメディアです。新聞しんぶん校閲こうえつ部門ぶもんは、まずはその事実じじつやデータにあやまりがないかを点検てんけんします。ふたは、ただしい、適切てきせつ日本語にほんごになっているかというところのチェックです。誤字ごじ脱字だつじ間違まちがいや矛盾むじゅん意味いみとおらないところがないかというところをます。そのさいに、間違まちがいではないけれども、朝日新聞社あさひしんぶんしゃない表記ひょうきのルールにっているかもチェックします。スタイルをそろえると、みやすい文章ぶんしょうになりますので。

それから、ひときずつける表現ひょうげん差別さべつ表現ひょうげん人権じんけん侵害しんがいするような文章ぶんしょうになっていないかも点検てんけんします。この部分ぶぶん画一かくいつてきなルールがあるわけではありません。この言葉ことば使つかわなければ大丈夫だいじょうぶだというものではありませんので、議論ぎろんしながらすすめていきます。

ほかにも、間違まちがいではないけれどかりにくい、ここにこのようなデータがあればかりやすいのではなどといった提案ていあんもします。あとは、記事きじひと見出みだしをつけるひとちが分業ぶんぎょうですので、記事きじ見出みだしの矛盾むじゅんがないか、全体ぜんたい整合せいごうせいます。

つまり、このままこの商品しょうひんてOKか? というところを役割やくわりです。よくうのは、「新聞しんぶん校閲こうえつ最終さいしゅう関門かんもんであり、最初さいしょ読者どくしゃである」ということですね。

――校閲こうえつ指摘してきするものには、どんなれいおおいのでしょうか。

比留間ひるま 記者きしゃ手書てがきで原稿げんこうき、なまり活字かつじひとひとひろっていた時代じだいには、物理ぶつりてき文字もじひろってしまうことや、上下じょうげがひっくりかえっているなどのあやまりがおもでした。入力にゅうりょく方法ほうほうがパソコンにわり、いまでは記者きしゃ自身じしん入力にゅうりょくするので、なんとってもおおいのは変換へんかんミスです。

「この漢字かんじはもしかしてこっちじゃないですか?」という指摘してき一番いちばんおおい。校閲こうえつ記者きしゃ変換へんかんミスとたたかっています。変換へんかんミスは新聞しんぶんかぎらず、漢字かんじ使つかかぎりはきてしまうものですね。

あか鉛筆えんぴつでの校閲こうえつ作業さぎょう様子ようす比留間ひるまさんにせてもらった

――新聞しんぶんにおける表記ひょうきのルールは時代じだいによってもわりますね。

比留間ひるま 差別さべつ用語ようごやジェンダーの表現ひょうげんなども時代じだいわせてルールしてきましたし、最近さいきんでしたらたとえばウクライナの首都しゅと表記ひょうきが「キエフ」から「キーウ」にわりました。このように時代じだい環境かんきょうわせてルールをめるのが、いまわたしつとめている用語ようご幹事かんじ仕事しごとです。

そのようにかさねてきた表記ひょうきのルールをまとめてガイドブックにしたものが『朝日新聞あさひしんぶん用語ようご手引てびき』、社内しゃないでは通称つうしょう赤本あかほん」とばれるものです。この赤本あかほんづくりの事務じむきょく用語ようご幹事かんじ仕事しごとです。

Typolessとの共同きょうどう作業さぎょう文章ぶんしょうをつくる

――新聞しんぶんしゃなどのマスメディアにかぎらず、最近さいきんではダイバーシティーやインクルージョンへの配慮はいりょはどの企業きぎょうでももとめられています。そのてんもTypolessは指摘してきしてくれるのですね。

倉井くらい ルール辞書じしょなかたとえば、「父母ちちははかい保護ほごしゃかい」や「キーマン→キーパーソン」のように、最近さいきんではいいかえたほうがいいような表現ひょうげん登録とうろくされています。くわえて、「炎上えんじょうリスクチェッカー」という機能きのうがあります。偏見へんけん差別さべつ攻撃こうげきてき表現ひょうげんふくまれている場合ばあいにAIが指摘してきしてくれるのです。

比留間ひるま 複雑ふくざつなことがらがからむもので、文脈ぶんみゃくによってはそのままでよい場合ばあいもあるでしょう。「ただしい日本語にほんごかどうか」などとはちがい、最後さいご判断はんだんをするのは人間にんげんですから。

ただ、朝日新聞あさひしんぶんはこれまで、差別さべつてき表現ひょうげんにならないよう、用語ようごのルールを拡充かくじゅうしてきました。また「この言葉ことばはどうあるべきか?」ということを日常にちじょうてき議論ぎろんしているのが、校閲こうえつ部門ぶもんです。

その経験けいけん知見ちけんかさなって、あるものは社内しゃない共通きょうつう認識にんしきになったり、あるものは用語ようごのルールになったりしてきました。

ネットやSNSじょうでは、議論ぎろんはげしくなって結局けっきょくたがいを遮断しゃだんしてわりという光景こうけいがよくられます。しかし、意見いけんはそれぞれだとしても、この議論ぎろんについてどういう観点かんてんがあるのかということを共有きょうゆうできれば、そこから相手あいて尊重そんちょうする表現ひょうげんえていけるのだとおもいます。

倉井くらい Typolessの指摘してきつねただしい、というわけではありませんが、ひとつのストッパーとして、そこで一度いちどまって、もっと適切てきせつ表現ひょうげんがないかかんがえてみる。そういうかたをしていただければとおもいます。

言葉ことば社会しゃかいのインフラで財産ざいさん」だとはな比留間ひるまさん

――Typolessを利用りようしているほうからは、どんなフィードバックがありますか。

倉井くらい レスポンスのはやさや、ずかしい間違まちがいを手元てもとでチェックできることがうれしいというお客様きゃくさまおおいです。意外いがいだったのは、朝日新聞あさひしんぶんのルール辞書じしょには同音どうおん異義いぎなどについて、言葉ことば使つかかたのTips(ヒント、コツ)がてくるんですが、最近さいきんはGoogle検索けんさくではなくTypolessで勉強べんきょうするといったほうもいました。

比留間ひるま 校閲こうえつ記者きしゃとしては、そこはぜひ本物ほんもの辞書じしょいてしいんですが……。

倉井くらい 最後さいごはもちろん辞書じしょいてしいですけど、Typolessのいところは実際じっさい文章ぶんしょうのなかで使つかいながら調しらべられるということですよね(笑)。

いろんな場面ばめんでTypolessを使つかってしいという倉井くらいさん(ひだり)と比留間ひるまさん

――どのような場面ばめん使つかってしいとおもいますか。

倉井くらい Typolessはベースが新聞しんぶん記事きじであるところから、フォーマルな言葉ことばとくされているとえます。なので、ビジネスで様々さまざま文章ぶんしょうには使つかえますよね。広報こうほう、IR、経営けいえい企画きかくのように、対外たいがいてき文章ぶんしょうくところ、とくにオウンドメディアを運用うんようされているほうからのご利用りようおおいです。校正こうせい時間じかん人的じんてきリソースがりないところで、Typolessがいソリューションとなっているようです。

開発かいはつしゃとしては、ぜん社員しゃいん使つかえるようにしていただけるとありがたいですね。APIといって、社内しゃないのシステムとつなげるプランもあります。稟議りんぎしょ議事ぎじろくなどの精度せいどがりますから。

比留間ひるま AI校正こうせいいところは、見落みおとしがすくないということだとおもいます。校閲こうえつ作業さぎょうをしていてかんじるのは、人間にんげん場合ばあい想定そうていしているあやまりはつけやすいんですが、想定そうていしていなかったあたらしい間違まちがいや、まれな間違まちがいはやはりつけにくいんです。

もちろん、すぐれたレシピで大量たいりょう生産せいさんできても、おいしいかどうか、その最後さいご微妙びみょうなジャッジをくだすのは人間にんげんです。文章ぶんしょうおなじ。そしてTypolessは、人間にんげん仕事しごとささえるための強力きょうりょくなツールです。AIとの共同きょうどう作業さぎょうで、よりよい文章ぶんしょうづくりが可能かのうになるとおもいます。