14回かい

AIの現場げんば適用てきよう時間じかんを短縮たんしゅくするAutoML（自動じどう機械きかい学習がくしゅう）

【2月がつ16日にち、17日にち開催かいさい】NEDO「AI NEXT FORUM 2023」で展示てんじされる最新さいしんAI技術ぎじゅつ（10）

特集とくしゅう

NEDO「AI NEXT FORUM 2023」

2023.02.15 16:00

文ぶん● 森山もりやま和道かずみち

　本ほん特集とくしゅうでは、2月がつ16日にち・17日にちに開催かいさいされるNEDO「AI NEXT FORUM 2023」でも展示てんじされる、社会しゃかい実装じっそうに向むけた最前線さいぜんせんのAI技術ぎじゅつを、全ぜん10回かいにわたって紹介しょうかいする。最後さいごとなる第だい10回かいは、AI技術ぎじゅつの現場げんば適用てきようを加速かそくするAutoML（自動じどう機械きかい学習がくしゅう）についてお届とどけする。

NEDO「次世代じせだい人工じんこう知能ちのう・ロボットの中核ちゅうかくとなるインテグレート技術ぎじゅつ開発かいはつ」プロジェクト
「自動じどう機械きかい学習がくしゅうによる人工じんこう知能ちのう技術ぎじゅつの導入どうにゅう加速かそくに関かんする研究けんきゅう開発かいはつ」

現場げんば適用てきよう時間じかんを短縮たんしゅくするAutoML（自動じどう機械きかい学習がくしゅう）

　人工じんこう知能ちのうは深層しんそうニューラルネットワークの発展はってんにより、文字もじ認識にんしきや物体ぶったいの抽出ちゅうしゅつなど様々さまざまなことができるようになった。リアルタイムで物体ぶったい検出けんしゅつする「YOLO」や、姿勢しせいを認識にんしきする「OpenPose」などのツールも多数たすう出でており、世界せかい最高峰さいこうほうの技術ぎじゅつがフリーで使つかえる。

　しかし産さん総研そうけんの大西おおにし正輝まさき氏しは「どんなデータでもうまくいくわけではない。自分じぶんたちのデータで試ためすとうまくいかないこともある。手法しゅほうやデータによってパラメータの調整ちょうせい、アーキテクチャの探索たんさくなどが必要ひつようになる」と課題かだいを指摘してきする。

産業さんぎょう技術ぎじゅつ総合そうごう研究所けんきゅうじょ人工じんこう知能ちのう研究けんきゅうセンター社会しゃかい知能ちのう研究けんきゅうチーム・研究けんきゅうチーム長ちょう
大西おおにし正輝まさき氏し

　過去かこにおいてはAI技術ぎじゅつの開発かいはつに多おおくの時間じかんを費ついやしていた。それが、世界せかい最高峰さいこうほうの技術ぎじゅつがネットですぐに公開こうかいされる世よの中なかになった。しかも簡単かんたんに、フリーで手てに入はいる。しかしながら、実際じっさいに現場げんばで使つかうには人ひとの手てによる試行錯誤しこうさくごがまだ必要ひつようだ。その試行錯誤しこうさくごの時間じかんが短縮たんしゅくされれば、現場げんば導入どうにゅう時間じかんの短縮たんしゅくが可能かのうになる。

　大西おおにし氏しらはハイパーパラメータの自動じどう調整ちょうせいによってAI技術ぎじゅつの現場げんば適用てきようを加速かそくするAutoML（自動じどう機械きかい学習がくしゅう）の研究けんきゅう開発かいはつに取とり組くんでいる。プロジェクトには、2つの研究所けんきゅうじょと6つの大学だいがく、そして企業きぎょう1社しゃが参画さんかくしている。

ハイパーパラメータ最適さいてき化か、ニューラルアーキテクチャサーチ、転移てんい学習がくしゅう

　目標もくひょうはAutoML（自動じどう機械きかい学習がくしゅう）によって、人工じんこう知能ちのうの現場げんば導入どうにゅう時間じかんを、従来じゅうらいの試行錯誤しこうさくご的てきなランダムな探索たんさくに比くらべて10％以下いかにすることだ。

　基本きほん的てきには最適さいてき化か計算けいさんをするのだが、問題もんだいは最適さいてき化かをどの程度ていどまでやるかだ。「良よい答こたえはすぐに見みつかるかもしれない。だが見みつからないかもしれない。それをいつまでやるか。いつまで最適さいてき化か計算けいさんをやればいいのか。それを決きめるための研究けんきゅうだ」。つまり、最適さいてき化かの最適さいてき停止ていしである。主おもに統計数理研究所とうけいすうりけんきゅうしょと名古屋大学なごやだいがくが担当たんとうしている。

　一回いっかいやるたびに、評価ひょうかも含ふくめて時間じかんがかかる。仮かりに一回いっかい評価ひょうかするのに１日にちかかるとすれば、10日とおかあっても10回かいしか最適さいてき化かできないことになる。そこで、最適さいてき化か計算けいさんを止とめる基準きじゅんを作つくって実装じっそうしようとしている。

　AutoMLには具体ぐたい的てきには３みっつの方法ほうほうがある。一ひとつ目めはネットワークのハイパーパラメータを調整ちょうせいするハイパーパラメータ最適さいてき化か (HPO)。HPOにはいくつかの方法ほうほうがあるが、古典こてん的てきな Nelder-Mead 法ほうやベイズ最適さいてき化かの一種いっしゅであるTPE（Tree-structured Parzen Estimator）を活用かつようしている。これで47%短縮たんしゅくできるという。

　２ふたつ目めはニューラルアーキテクチャサーチ（NAS）。ニューラルネットワークの構造こうぞうを人ひとが設計せっけいするのではなく、それ自体じたいを自動じどうで探索たんさくする方法ほうほうだ。2022年ねん時点じてんで、一いち度どの探索たんさくで複数ふくすうの異ことなるサイズのアーキテクチャを獲得かくとくできる高速こうそく・多目的たもくてきのワンショットNASを開発かいはつしており、他たの方法ほうほうよりも17％速はやくできている。オープンソースにして広ひろく使つかってもらえるようにしながら、実際じっさいに使つかわれるにはどういうNASが良よいのかを調査ちょうさしながら進すすめているという。主おもに横浜国立大学よこはまこくりつだいがくと筑波大学つくばだいがくが担当たんとうしている。

　探索たんさく時じにネットワークの重おもみを学習がくしゅうしないゼロショットNASの研究けんきゅうも行おこなっているが、いまのところ性能せいのうや計算けいさんコストのバランスを考かんがえて、ワンショットNASを採用さいようする予定よていだ。「ワンショットは一いち度どだけ重おもみの学習がくしゅうをする。ゼロショットは一いち度どもしない。普通ふつうは何なん度どもするから時間じかんがかかる。ワンショットにしてもゼロショットにしても、重おもみ計算けいさんを何なん度どもしないことで計算けいさん時間じかんが削減さくげんされる。そこがキー。速度そくどはゼロショットのほうが速はやいが、精度せいどはワンショットのほうが適切てきせつだと考かんがえている」（大西おおにし氏し）。

　３みっつ目めは転移てんい学習がくしゅう。他たのデータセットを使つかって事前じぜんにある程度ていどパラメータを探さがしておいて他たのデータセットに転移てんいさせる手法しゅほうだ。こうすることで、より速はやく最適さいてき化かしながら、より良よいモデルを作つくることができる。学習がくしゅう方法ほうほうによって特徴とくちょう量りょうが違ちがうのではないかと考かんがえており、知識ちしき転移てんいを用もちいた自己じこ教師きょうしあり学習がくしゅうを研究けんきゅうしている。画像がぞう識別しきべつをターゲットにして、主おもに中部大学ちゅうぶだいがくが担当たんとうしている。

　これらを組くみ合あわせて、モデルサイズはできるだけ小ちいさく、かつ、認識にんしき精度せいどが高たかいモデルを作つくる。小ちいさいモデルであれば組くみ込こみにも使つかえる。一方いっぽう、計算けいさんリソースが潤沢じゅんたくでモデルサイズ自体じたいは大おおきくなってもいいのであれば、認識にんしき精度せいどを優先ゆうせんすることもできる。このように、用途ようとに応おうじて多た目的もくてき最適さいてき化かを解とくことで、できるだけ精度せいどが高たかく、かつ、モデルが小ちいさいものをデータに合あわせて自動じどうで探索たんさくするシステムを開発かいはつしている。

実じつ問題もんだいでは画像がぞう識別しきべつに取とり組くむ

　プロジェクト自体じたいでは、基礎きそ的てきな研究けんきゅうから、実際じっさいに実じつ問題もんだいでソフトウェアを実装じっそうする取とり組くみや、オープンソースで公開こうかいすることも行おこなっているという。

　産業さんぎょう応用おうようについては、主おもに画像がぞう識別しきべつに取とり組くんでいる。実じつ問題もんだいとして、車くるまの写真しゃしんのデータセットを作つくってその自動じどう分類ぶんるいに使つかえるか、また不動産ふどうさんのデータセットを作つくって、そちらも同様どうように検証けんしょうしている。「不動産ふどうさん業者ぎょうしゃや中古ちゅうこ車しゃ販売はんばいの人ひとたちは、実際じっさいに従業じゅうぎょう員いんが現地げんちに行いって、写真しゃしんを大量たいりょうに撮影さつえいして手動しゅどうで分類ぶんるいし、タグをつけている。そして『ここが台所だいどころ、ここが寝室しんしつ』、『この車くるまは何なんの種類しゅるいで何なん年ねん式しき』だといったデータを作つくっている。それを模擬もぎしたデータと識別しきべつモデルを作つくって、自動じどう化かを検証けんしょうしている」（大西おおにし氏し）。

　また、東京工業大学とうきょうこうぎょうだいがくと東北大学とうほくだいがくが担当たんとうして、動画どうが像ぞう（時とき系列けいれつ情報じょうほう）を処理しょりしたり、視覚しかくと言語げんごとを融合ゆうごうしたタスクなどにおいては、Transformerのような大だい規模きぼなアーキテクチャを用もちいてニューラルネットワークサーチを行おこなうことが有効ゆうこうかどうかを検証けんしょうしたりして、利用りようの開拓かいたくに取とり組くんでいる。主おもにこの６本立ほんだてでプロジェクトに取とり組くんでいる。

手軽てがるにハイパーパラメータ最適さいてき化かができるソフトウェア「aiaccel」を公開こうかい

　このほか、ハイパーパラメータ最適さいてき化か（HPA）、ニューラルアーキテクチャサーチ（NAS）を活用かつようした食品しょくひん中ちゅうの異物いぶつの自動じどう発見はっけんのためのネットワーク自動じどう探索たんさくなどにも取とり組くんでいる。

実際じっさいのビジネスに即そくしたデータを使つかった例れい。写真しゃしんは食品しょくひん中ちゅうの異物いぶつ検出けんしゅつ

　また、自分じぶんたちのデータに適てきした方法ほうほうで自動的じどうてきにネットワークを作つくるプログラム「aiaccel（アイアクセル）」をオープンソースソフトウェアとして公開こうかい。一部いちぶユーザーに使つかってもらって検証けんしょうしている。

　aiaccelはローカルでも使つかえるが、産さん総研そうけんの大だい規模きぼAIクラウド計算けいさんシステム「ABCI（AI橋渡はしわたしクラウド）」で使つかうこともできる。HPOモジュールとNASモジュールがあり、HPO最適さいてき化かモジュールは完成かんせいしているが、NASモジュールについては現在げんざい実装じっそう中ちゅうの段階だんかいだという。

広ひろく使つかってもらうためにはバランスが重要じゅうよう

　認識にんしき精度せいどが一番いちばん高たかくなるパラメータを探索たんさくするパラメータ最適さいてき化かの基礎きそ研究けんきゅうについては、基礎きそだけに応用おうよう範囲はんいは広ひろく、最適さいてき化かに関かんする問題もんだいであれば様々さまざまな活用かつようがあり得える。いっぽう、アーキテクチャサーチと転移てんい学習がくしゅうは、画像がぞう認識にんしきへの利用りようを想定そうていして取とり組くんでいる。

「AI開発かいはつには2つの軸じくがある」と大西おおにし氏しはいう。「ひとつは高性能こうせいのうで少すこしでも良よい精度せいどのものをという軸じく。論文ろんぶんの場合ばあいはこちらです。しかし、みんなに色々いろいろ使つかってもらおうと思おもうと精度せいどだけではなく安定あんてい性せいや使つかいやすさなどのバランスをとったほうがいい」。

　このプロジェクトには各かく技術ぎじゅつを開発かいはつする大学だいがく・研究けんきゅう機関きかんのほか、データ活用かつように強つよみを持もつ企業きぎょうとして、ブレインパッドが参加さんかしている。ブレインパッドには、実じつデータを使つかってしっかりと実証じっしょう実験じっけんを回まわしていけるかを検証けんしょうしてもらっているという。中古ちゅうこ車しゃ販売はんばいや不動産ふどうさんという話はなしも、彼かれらがこれまでに実際じっさいに受うけたビジネス案件あんけんのなかから出でてきたものだ。「研究けんきゅうサイドは評価ひょうかしやすいこともあって学術がくじゅつ論文ろんぶんだと精度せいどを競きそうところがある。しかしビジネスでは精度せいどのみを競きそっても仕方しかたない。ブレインパッドには実じつビジネスでの使つかいやすさを評価ひょうかしてもらってます」（大西おおにし氏し）。

　研究けんきゅう開発かいはつ方法ほうほうも、時代じだいとともに変かわってきたと感かんじているという。「昔むかしはソフトウェアを自前じまえで作つくって販売はんばいするビジネスでした。それが広ひろく公開こうかいして他たの人ひとにも使つかえるようになり、世よの中なかの研究けんきゅうスピードが速はやくなった。公開こうかいすることで情報じょうほうと人ひとが集あつまるようになっています。開発かいはつだけしていてもダメだし、研究けんきゅうだけしていてもダメ。そこで国際こくさい会議かいぎや論文ろんぶん発表はっぴょうにも力ちからを入いれて、活動かつどうが周囲しゅういから見みえるようにしています。周囲しゅういから見みえるようになれば、人ひとが集あつまるし、情報じょうほうも集あつまる。人ひとと情報じょうほうが循環じゅんかんする仕組しくみをどう作つくるかが重要じゅうようだなと思おもっています」（大西おおにし氏し）。

　開発かいはつしたソフトウェアも基本きほん的てきにオープンソースで公開こうかいしている。「みんながコントリビューターになれる時代じだい。輪わが広ひろがっていくといいなと思おもっている」という。ハイパーパラメータ最適さいてき化かなどのモジュールについても公開こうかいのコンテストも行おこなっている。「もっと良よいモジュールを作つくれる人ひともいるかもしれない。aiaccel自体じたいも外部がいぶモジュールを組くみ合あわせることができるので、より良よいモジュールを探さがしている」とのこと。コンテストは来年度らいねんども行おこなわれる予定よていで、広ひろく参加さんか者しゃを募集ぼしゅうしているという。

お申もうし込こみはコチラから！（Peatix）

開催かいさい概要がいよう
名称めいしょう：AI NEXT FORUM 2023－ビジネスとAI最新さいしん技術ぎじゅつが出会であう、新あらたなイノベーションが芽生めばえる－
日時にちじ：2023年ねん2月がつ16日にち（木き）、17日にち（金かね）10時じ00分ふん～17時じ00分ふん
場所ばしょ：ベルサール御成門おなりもんタワー「4Fホール」（〒105-0011 東京とうきょう都と港みなと区く芝公園しばこうえん1-1-1 住友不動産すみともふどうさん御成門おなりもんタワー4F）
アクセス：都営とえい三田みた線せん御成門おなりもん駅えき A3b出口でぐち直結ちょっけつ、都営とえい大江戸おおえど線せん・浅草線あさくさせん大門おおかど駅えき A6出口でぐち徒歩とほ6分ふん、JR浜松町はままつちょう駅えき北口きたぐち徒歩とほ10分ふん、東京とうきょうモノレール浜松町はままつちょう駅えき北口きたぐち徒歩とほ11分ふん
参加さんか：無料むりょう（事前じぜん登録とうろく制せい）
内容ないよう：AI技術ぎじゅつに関かんする研究けんきゅう成果せいかを実機じっきやポスター展示てんじなどにより対面たいめん形式けいしきで解説かいせつ（出展しゅってん数すう：最大さいだい44件けん）、各種かくしゅ講演こうえんやトークセッションを実施じっし（会場かいじょう参加さんかとオンライン配信はいしんのハイブリッド形式けいしき）
主催しゅさい：国立こくりつ研究けんきゅう開発かいはつ法人ほうじん新しんエネルギー・産業さんぎょう技術ぎじゅつ総合そうごう開発かいはつ機構きこう
運営うんえい委託いたく先さき：株式会社かぶしきがいしゃ角川かどかわアスキー総合そうごう研究所けんきゅうじょ

■関連かんれんサイト

国立こくりつ研究けんきゅう開発かいはつ法人ほうじん新しんエネルギー・産業さんぎょう技術ぎじゅつ総合そうごう開発かいはつ機構きこう

申もうし込こみページ(Peatix)

「ASCII STARTUPウィークリーレビュー」配信はいしんのご案内あんない

ASCII STARTUPでは、「ASCII STARTUPウィークリーレビュー」と題だいしたメールマガジンにて、国内こくない最先端さいせんたんのスタートアップ情報じょうほう、イベントレポート、関連かんれんするエコシステム識者しきしゃなどの取材しゅざい成果せいかを毎週まいしゅう月曜げつように配信はいしんしています。興味きょうみがある方ほうは、以下いかの登録とうろくフォームボタンをクリックいただき、メールアドレスの設定せっていをお願ねがいいたします。