(Translated by https://www.hiragana.jp/)
AIの現場適用時間を短縮するAutoML(自動機械学習) : - ASCII STARTUP

メルマガはこちらから

PAGE
TOP

AIの現場げんば適用てきよう時間じかん短縮たんしゅくするAutoML(自動じどう機械きかい学習がくしゅう

【2がつ16にち、17にち開催かいさい】NEDO「AI NEXT FORUM 2023」で展示てんじされる最新さいしんAI技術ぎじゅつ(10)

特集とくしゅう
NEDO「AI NEXT FORUM 2023」

 ほん特集とくしゅうでは、2がつ16にち・17にち開催かいさいされるNEDO「AI NEXT FORUM 2023」でも展示てんじされる、社会しゃかい実装じっそうけた最前線さいぜんせんのAI技術ぎじゅつを、ぜん10かいにわたって紹介しょうかいする。最後さいごとなるだい10かいは、AI技術ぎじゅつ現場げんば適用てきよう加速かそくするAutoML(自動じどう機械きかい学習がくしゅう)についておとどけする。

NEDO「次世代じせだい人工じんこう知能ちのう・ロボットの中核ちゅうかくとなるインテグレート技術ぎじゅつ開発かいはつ」プロジェクト
自動じどう機械きかい学習がくしゅうによる人工じんこう知能ちのう技術ぎじゅつ導入どうにゅう加速かそくかんする研究けんきゅう開発かいはつ

現場げんば適用てきよう時間じかん短縮たんしゅくするAutoML(自動じどう機械きかい学習がくしゅう

 人工じんこう知能ちのう深層しんそうニューラルネットワークの発展はってんにより、文字もじ認識にんしき物体ぶったい抽出ちゅうしゅつなど様々さまざまなことができるようになった。リアルタイムで物体ぶったい検出けんしゅつする「YOLO」や、姿勢しせい認識にんしきする「OpenPose」などのツールも多数たすうており、世界せかい最高峰さいこうほう技術ぎじゅつがフリーで使つかえる。

 しかしさん総研そうけん大西おおにし正輝まさきは「どんなデータでもうまくいくわけではない。自分じぶんたちのデータでためすとうまくいかないこともある。手法しゅほうやデータによってパラメータの調整ちょうせい、アーキテクチャの探索たんさくなどが必要ひつようになる」と課題かだい指摘してきする。

産業さんぎょう技術ぎじゅつ総合そうごう研究所けんきゅうじょ 人工じんこう知能ちのう研究けんきゅうセンター 社会しゃかい知能ちのう研究けんきゅうチーム・研究けんきゅうチームちょう
大西おおにし 正輝まさき

 過去かこにおいてはAI技術ぎじゅつ開発かいはつおおくの時間じかんついやしていた。それが、世界せかい最高峰さいこうほう技術ぎじゅつがネットですぐに公開こうかいされるなかになった。しかも簡単かんたんに、フリーではいる。しかしながら、実際じっさい現場げんば使つかうにはひとによる試行錯誤しこうさくごがまだ必要ひつようだ。その試行錯誤しこうさくご時間じかん短縮たんしゅくされれば、現場げんば導入どうにゅう時間じかん短縮たんしゅく可能かのうになる。

 大西おおにしらはハイパーパラメータの自動じどう調整ちょうせいによってAI技術ぎじゅつ現場げんば適用てきよう加速かそくするAutoML(自動じどう機械きかい学習がくしゅう)の研究けんきゅう開発かいはつんでいる。プロジェクトには、2つの研究所けんきゅうじょと6つの大学だいがく、そして企業きぎょう1しゃ参画さんかくしている。

ハイパーパラメータ最適さいてき、ニューラルアーキテクチャサーチ、転移てんい学習がくしゅう

 目標もくひょうはAutoML(自動じどう機械きかい学習がくしゅう)によって、人工じんこう知能ちのう現場げんば導入どうにゅう時間じかんを、従来じゅうらい試行錯誤しこうさくごてきなランダムな探索たんさくくらべて10%以下いかにすることだ。

 基本きほんてきには最適さいてき計算けいさんをするのだが、問題もんだい最適さいてきをどの程度ていどまでやるかだ。「こたえはすぐにつかるかもしれない。だがつからないかもしれない。それをいつまでやるか。いつまで最適さいてき計算けいさんをやればいいのか。それをめるための研究けんきゅうだ」。つまり、最適さいてき最適さいてき停止ていしである。おも統計数理研究所とうけいすうりけんきゅうしょ名古屋大学なごやだいがく担当たんとうしている。

 一回いっかいやるたびに、評価ひょうかふくめて時間じかんがかかる。かり一回いっかい評価ひょうかするのに1にちかかるとすれば、10日とおかあっても10かいしか最適さいてきできないことになる。そこで、最適さいてき計算けいさんめる基準きじゅんつくって実装じっそうしようとしている。

 AutoMLには具体ぐたいてきにはみっつの方法ほうほうがある。ひとはネットワークのハイパーパラメータを調整ちょうせいするハイパーパラメータ最適さいてき (HPO)。HPOにはいくつかの方法ほうほうがあるが、古典こてんてきな Nelder-Mead ほうやベイズ最適さいてき一種いっしゅであるTPE(Tree-structured Parzen Estimator)を活用かつようしている。これで47%短縮たんしゅくできるという。

 ふたはニューラルアーキテクチャサーチ(NAS)。ニューラルネットワークの構造こうぞうひと設計せっけいするのではなく、それ自体じたい自動じどう探索たんさくする方法ほうほうだ。2022ねん時点じてんで、いち探索たんさく複数ふくすうことなるサイズのアーキテクチャを獲得かくとくできる高速こうそく多目的たもくてきのワンショットNASを開発かいはつしており、方法ほうほうよりも17%はやくできている。オープンソースにしてひろ使つかってもらえるようにしながら、実際じっさい使つかわれるにはどういうNASがいのかを調査ちょうさしながらすすめているという。おも横浜国立大学よこはまこくりつだいがく筑波大学つくばだいがく担当たんとうしている。

 探索たんさくにネットワークのおもみを学習がくしゅうしないゼロショットNASの研究けんきゅうおこなっているが、いまのところ性能せいのう計算けいさんコストのバランスをかんがえて、ワンショットNASを採用さいようする予定よていだ。「ワンショットはいちだけおもみの学習がくしゅうをする。ゼロショットはいちもしない。普通ふつうなんもするから時間じかんがかかる。ワンショットにしてもゼロショットにしても、おも計算けいさんなんもしないことで計算けいさん時間じかん削減さくげんされる。そこがキー。速度そくどはゼロショットのほうがはやいが、精度せいどはワンショットのほうが適切てきせつだとかんがえている」(大西おおにし)。

 みっ転移てんい学習がくしゅうのデータセットを使つかって事前じぜんにある程度ていどパラメータをさがしておいてのデータセットに転移てんいさせる手法しゅほうだ。こうすることで、よりはや最適さいてきしながら、よりいモデルをつくることができる。学習がくしゅう方法ほうほうによって特徴とくちょうりょうちがうのではないかとかんがえており、知識ちしき転移てんいもちいた自己じこ教師きょうしあり学習がくしゅう研究けんきゅうしている。画像がぞう識別しきべつをターゲットにして、おも中部大学ちゅうぶだいがく担当たんとうしている。

 これらをわせて、モデルサイズはできるだけちいさく、かつ、認識にんしき精度せいどたかいモデルをつくる。ちいさいモデルであればみにも使つかえる。一方いっぽう計算けいさんリソースが潤沢じゅんたくでモデルサイズ自体じたいおおきくなってもいいのであれば、認識にんしき精度せいど優先ゆうせんすることもできる。このように、用途ようとおうじて目的もくてき最適さいてきくことで、できるだけ精度せいどたかく、かつ、モデルがちいさいものをデータにわせて自動じどう探索たんさくするシステムを開発かいはつしている。

じつ問題もんだいでは画像がぞう識別しきべつ

 プロジェクト自体じたいでは、基礎きそてき研究けんきゅうから、実際じっさいじつ問題もんだいでソフトウェアを実装じっそうするみや、オープンソースで公開こうかいすることもおこなっているという。

 産業さんぎょう応用おうようについては、おも画像がぞう識別しきべつんでいる。じつ問題もんだいとして、くるま写真しゃしんのデータセットをつくってその自動じどう分類ぶんるい使つかえるか、また不動産ふどうさんのデータセットをつくって、そちらも同様どうよう検証けんしょうしている。「不動産ふどうさん業者ぎょうしゃ中古ちゅうこしゃ販売はんばいひとたちは、実際じっさい従業じゅうぎょういん現地げんちって、写真しゃしん大量たいりょう撮影さつえいして手動しゅどう分類ぶんるいし、タグをつけている。そして『ここが台所だいどころ、ここが寝室しんしつ』、『このくるまなん種類しゅるいなんねんしき』だといったデータをつくっている。それを模擬もぎしたデータと識別しきべつモデルをつくって、自動じどう検証けんしょうしている」(大西おおにし)。

 また、東京工業大学とうきょうこうぎょうだいがく東北大学とうほくだいがく担当たんとうして、動画どうがぞうとき系列けいれつ情報じょうほう)を処理しょりしたり、視覚しかく言語げんごとを融合ゆうごうしたタスクなどにおいては、Transformerのようなだい規模きぼなアーキテクチャをもちいてニューラルネットワークサーチをおこなうことが有効ゆうこうかどうかを検証けんしょうしたりして、利用りよう開拓かいたくんでいる。おもにこの6本立ほんだてでプロジェクトにんでいる。

手軽てがるにハイパーパラメータ最適さいてきができるソフトウェア「aiaccel」を公開こうかい

 このほか、ハイパーパラメータ最適さいてき(HPA)、ニューラルアーキテクチャサーチ(NAS)を活用かつようした食品しょくひんちゅう異物いぶつ自動じどう発見はっけんのためのネットワーク自動じどう探索たんさくなどにもんでいる。

実際じっさいのビジネスにそくしたデータを使つかったれい写真しゃしん食品しょくひんちゅう異物いぶつ検出けんしゅつ

 また、自分じぶんたちのデータにてきした方法ほうほう自動的じどうてきにネットワークをつくるプログラム「aiaccel(アイアクセル)」をオープンソースソフトウェアとして公開こうかい一部いちぶユーザーに使つかってもらって検証けんしょうしている。

 aiaccelはローカルでも使つかえるが、さん総研そうけんだい規模きぼAIクラウド計算けいさんシステム「ABCI(AI橋渡はしわたしクラウド)」で使つかうこともできる。HPOモジュールとNASモジュールがあり、HPO最適さいてきモジュールは完成かんせいしているが、NASモジュールについては現在げんざい実装じっそうちゅう段階だんかいだという。

ひろ使つかってもらうためにはバランスが重要じゅうよう

 認識にんしき精度せいど一番いちばんたかくなるパラメータを探索たんさくするパラメータ最適さいてき基礎きそ研究けんきゅうについては、基礎きそだけに応用おうよう範囲はんいひろく、最適さいてきかんする問題もんだいであれば様々さまざま活用かつようがありる。いっぽう、アーキテクチャサーチと転移てんい学習がくしゅうは、画像がぞう認識にんしきへの利用りよう想定そうていしてんでいる。

「AI開発かいはつには2つのじくがある」と大西おおにしはいう。「ひとつは高性能こうせいのうすこしでも精度せいどのものをというじく論文ろんぶん場合ばあいはこちらです。しかし、みんなに色々いろいろ使つかってもらおうとおもうと精度せいどだけではなく安定あんていせい使つかいやすさなどのバランスをとったほうがいい」。

 このプロジェクトにはかく技術ぎじゅつ開発かいはつする大学だいがく研究けんきゅう機関きかんのほか、データ活用かつようつよみを企業きぎょうとして、ブレインパッドが参加さんかしている。ブレインパッドには、じつデータを使つかってしっかりと実証じっしょう実験じっけんまわしていけるかを検証けんしょうしてもらっているという。中古ちゅうこしゃ販売はんばい不動産ふどうさんというはなしも、かれらがこれまでに実際じっさいけたビジネス案件あんけんのなかからてきたものだ。「研究けんきゅうサイドは評価ひょうかしやすいこともあって学術がくじゅつ論文ろんぶんだと精度せいどきそうところがある。しかしビジネスでは精度せいどのみをきそっても仕方しかたない。ブレインパッドにはじつビジネスでの使つかいやすさを評価ひょうかしてもらってます」(大西おおにし)。

 研究けんきゅう開発かいはつ方法ほうほうも、時代じだいとともにわってきたとかんじているという。「むかしはソフトウェアを自前じまえつくって販売はんばいするビジネスでした。それがひろ公開こうかいしてひとにも使つかえるようになり、なか研究けんきゅうスピードがはやくなった。公開こうかいすることで情報じょうほうひとあつまるようになっています。開発かいはつだけしていてもダメだし、研究けんきゅうだけしていてもダメ。そこで国際こくさい会議かいぎ論文ろんぶん発表はっぴょうにもちかられて、活動かつどう周囲しゅういからえるようにしています。周囲しゅういからえるようになれば、ひとあつまるし、情報じょうほうあつまる。ひと情報じょうほう循環じゅんかんする仕組しくみをどうつくるかが重要じゅうようだなとおもっています」(大西おおにし)。

 開発かいはつしたソフトウェアも基本きほんてきにオープンソースで公開こうかいしている。「みんながコントリビューターになれる時代じだいひろがっていくといいなとおもっている」という。ハイパーパラメータ最適さいてきなどのモジュールについても公開こうかいのコンテストもおこなっている。「もっといモジュールをつくれるひともいるかもしれない。aiaccel自体じたい外部がいぶモジュールをわせることができるので、よりいモジュールをさがしている」とのこと。コンテストは来年度らいねんどおこなわれる予定よていで、ひろ参加さんかしゃ募集ぼしゅうしているという。

開催かいさい概要がいよう
名称めいしょう:AI NEXT FORUM 2023-ビジネスとAI最新さいしん技術ぎじゅつ出会であう、あらたなイノベーションが芽生めばえる-
日時にちじ:2023ねん2がつ16にち)、17にちかね)1000ふん~1700ふん
場所ばしょベルサール御成門おなりもんタワー「4Fホール」(〒105-0011 東京とうきょうみなと芝公園しばこうえん1-1-1 住友不動産すみともふどうさん御成門おなりもんタワー4F)
アクセス:都営とえい三田みたせん 御成門おなりもんえき A3b出口でぐち直結ちょっけつ都営とえい大江戸おおえどせん浅草線あさくさせん 大門おおかどえき A6出口でぐち徒歩とほ6ふん、JR浜松町はままつちょうえき 北口きたぐち徒歩とほ10ふん東京とうきょうモノレール 浜松町はままつちょうえき 北口きたぐち徒歩とほ11ふん
参加さんか無料むりょう事前じぜん登録とうろくせい
内容ないよう:AI技術ぎじゅつかんする研究けんきゅう成果せいか実機じっきやポスター展示てんじなどにより対面たいめん形式けいしき解説かいせつ出展しゅってんすう最大さいだい44けん)、各種かくしゅ講演こうえんやトークセッションを実施じっし会場かいじょう参加さんかとオンライン配信はいしんのハイブリッド形式けいしき
主催しゅさい国立こくりつ研究けんきゅう開発かいはつ法人ほうじんしんエネルギー・産業さんぎょう技術ぎじゅつ総合そうごう開発かいはつ機構きこう
運営うんえい委託いたくさき株式会社かぶしきがいしゃ角川かどかわアスキー総合そうごう研究所けんきゅうじょ

「ASCII STARTUPウィークリーレビュー」配信はいしんのご案内あんない

ASCII STARTUPでは、「ASCII STARTUPウィークリーレビュー」とだいしたメールマガジンにて、国内こくない最先端さいせんたんのスタートアップ情報じょうほう、イベントレポート、関連かんれんするエコシステム識者しきしゃなどの取材しゅざい成果せいか毎週まいしゅう月曜げつよう配信はいしんしています。興味きょうみがあるほうは、以下いか登録とうろくフォームボタンをクリックいただき、メールアドレスの設定せっていをおねがいいたします。

わせてみたい編集へんしゅうしゃオススメ記事きじ

バックナンバー