(Translated by https://www.hiragana.jp/)
ImageNet - Wikipedia コンテンツにスキップ

ImageNet

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

ImageNetは、物体ぶったい認識にんしきソフトウェアの研究けんきゅうもちいるために設計せっけいされただい規模きぼ画像がぞうデータベースである。ImageNetでは、1400まんえる[1][2]画像がぞう手作業てさぎょうアノテーションおこない、画像がぞうにどのような物体ぶったいうつっているかをしめしている。また、100まんまい以上いじょう画像がぞうバウンディングボックス英語えいごばん付与ふよされている[3][注釈ちゅうしゃく 1]。ImageNetには、20,000をえるカテゴリがあり、そのなかには「気球ききゅう(balloon)」や「イチゴ(strawberry)」といったすうひゃくまい画像がぞう構成こうせいされる一般いっぱんてき物体ぶったいカテゴリもふくまれる[4]。2010ねんから2017ねんまで、ImageNetプロジェクトは毎年まいとしだい規模きぼ[5]画像がぞう認識にんしき技術ぎじゅつコンテストであるILSVRC(the ImageNet Large Scale Visual Recognition Challenge)を開催かいさいしていた。このコンテストは、ソフトウェアが物体ぶったい情景じょうけいをどれだけただしく分類ぶんるい検出けんしゅつできるかをきそうものである[6]。チャレンジでは、重複じゅうふくしないように調整ちょうせいされた1000のカテゴリが利用りようされる[7]論文ろんぶんにより、いまのImageNetの最高さいこうなレコードは「CoCa(finetune)」である。[8]

深層しんそう学習がくしゅうへの貢献こうけん

[編集へんしゅう]

2012ねん9がつ30にちAlexNet[9]ばれるたたみニューラルネットワーク(CNN)が、ILSVRC2012においてトップ5エラー[注釈ちゅうしゃく 2]で16.4%を達成たっせいした[11]。これは、次点じてんのものよりやく10%程度ていどひくであった[11]エコノミストによれば、「ディープラーニングは突如とつじょとして、AIコミュニティにまらず、テクノロジー業界ぎょうかい全体ぜんたい注目ちゅうもくあつめるようになった。」とひょうしている[4][12][13]

2015ねんには、Microsoft開発かいはつした100そうえる非常ひじょうそうふかいCNNがAlexNetを上回うわまわり、ImageNet2015コンテストで優勝ゆうしょうした[14]

こうした大幅おおはば性能せいのう向上こうじょう理由りゆうとして、深層しんそう学習がくしゅうモデルの構造こうぞう発達はったつしたことや深層しんそう学習がくしゅうモデルの学習がくしゅう並列へいれつ計算けいさんもちいられるGPU性能せいのう向上こうじょういちじるしいことにくわえ、深層しんそう学習がくしゅうモデルを十分じゅうぶん学習がくしゅうできるImageNetのようなだい規模きぼデータセットが登場とうじょうしたこともげられている[15][16]

ILSVRCは2017ねん終了しゅうりょうしている[5]が、ImageNetのデータベースは現在げんざいでもモデルやアルゴリズムの性能せいのう比較ひかくするためのベンチマークとして画像がぞう認識にんしき分野ぶんやでしばしば利用りようされている[17][18]

データベースの歴史れきし

[編集へんしゅう]

AI研究けんきゅうしゃフェイフェイ・リは、2006ねんにImageNetのアイデアにはじめた。当時とうじだい部分ぶぶんのAI研究けんきゅうがモデルとアルゴリズムに焦点しょうてんわせていたなか、LiはAIアルゴリズムの学習がくしゅう利用りようできるデータセットを拡張かくちょう改善かいぜんしたいとかんがえていた[19]。2007ねんに、LiはWordNet作成さくせいしゃ1人ひとりであるプリンストン大学ぷりんすとんだいがくのChristiane Fellbaum教授きょうじゅ面会めんかいし、プロジェクトについてはなった。この議論ぎろん結果けっか、LiはWordNetの単語たんごデータベースをもとに、ImageNetの構築こうちくすすめた[20]

プリンストン大学ぷりんすとんだいがく助教授じょきょうじゅとして、LiはImageNetプロジェクトにむための研究けんきゅうしゃチームを編成へんせいした。かれらはAmazonMechanicalTurk利用りようして画像がぞう分類ぶんるい支援しえんした[20]

かれらは、フロリダで開催かいさいされた2009ねんのConference on Computer Vision and Pattern Recognition(CVPR英語えいごばん)で、はじめてデータベースを対外たいがいけにポスターで発表はっぴょうした[20][21][22]

データセット

[編集へんしゅう]

ImageNetは、アノテーションの工程こうていクラウドソーシングしている[7]画像がぞうレベルのアノテーションは、「この画像がぞうにトラがいる」「この画像がぞうにはトラがいない」といった、画像がぞうない特定とくていのクラスのオブジェクトが存在そんざいするかどうかをしめす。オブジェクトレベルのアノテーションは、しめされたオブジェクトの周囲しゅういにバウンディングボックスをあたえる。 ImageNetは、WordNetのカテゴリを使用しようしてオブジェクトを分類ぶんるいしている。たとえばいぬたいしては120のいぬしゅのカテゴリでけられる[23]など、こまかく分類ぶんるいされている。WordNetのカテゴリを使用しようすることの欠点けってんとして、ImageNetにたいして本来ほんらい最適さいてきなカテゴリけよりも高尚こうしょうなものになっている可能かのうせいがあることがげられる。 2012ねん、ImageNetはアカデミックユーザーとしてMechanicalTurkを世界せかいもっと利用りようしていた。平均へいきんてきなアノテーション作業さぎょうしゃは、1ふんあたり50まい画像がぞう識別しきべつした[2]。 ImageNetは画像がぞうのURLと画像がぞうそれぞれにたいするアノテーションのデータベースを提供ていきょうしており、ImageNetから直接ちょくせつ無料むりょうでダウンロードできるが、実際じっさい画像がぞう自体じたいはImageNetが所有しょゆうしているわけではない[24]

ImageNet Challengeの歴史れきし

[編集へんしゅう]
ImageNetで評価ひょうかしたエラーりつ履歴りれきかくとし参加さんかチームのなか性能せいのうじゅんに10エントリを抽出ちゅうしゅつ

ImageNet Large Scale Visual Recognition Challenge(ILSVRC)は、2010ねんから2017ねんまで毎年まいとし実施じっしされていた[25]画像がぞう認識にんしきコンテストで、アルゴリズムをもちいて学習がくしゅうしたモデルがImageNetのデータを分類ぶんるい検出けんしゅつする能力のうりょくきそうものである[6]。ILSVRCは、2005ねん設立せつりつされたPASCAL VOCチャレンジという、より小規模しょうきぼなコンテストののちぐことを目的もくてきとしたものである[26]。PASCAL VOCチャレンジには、やく20,000まい画像がぞうと20の分類ぶんるいクラスしかふくまれていなかった[27]。ImageNetをひらかれたものにするため、Fei-FeiLiはPASCAL VOCチームに協同きょうどうすることを提案ていあんした。このみは、研究けんきゅうチームが特定とくていのデータセットでアルゴリズムを評価ひょうかし、いくつかの視覚しかく認識にんしきタスクでよりたか精度せいど達成たっせいするために競争きょうそうするというもので[20]、これがILSVRCのはじまりである。

ILSVRCは、ImageNetの分類ぶんるい体系たいけいによって分類ぶんるいされた1000の画像がぞうカテゴリから構成こうせいされるデータセットを使用しようする[注釈ちゅうしゃく 3][7]。2010年代ねんだいは、画像がぞう処理しょり劇的げきてき進歩しんぽした時期じきである。2011ねんごろには、ILSVRCの分類ぶんるいタスクにおけるTop-5 エラーりつやく25%だった[11]。その2012ねんには、AlexNetばれる深層しんそうたたみニューラルネットもちいたモデルがTop-5 エラーりつやく16%を達成たっせいした[11]。さらにそこからのすう年間ねんかんで、Top-5エラーりつすうパーセントまで低下ていかした[29]。2012ねんのAlexNetのブレイクスルーは「それまでに存在そんざいしていたもののわせ」[注釈ちゅうしゃく 4]であったが、AlexNetは大量たいりょうのデータを学習がくしゅうすることで劇的げきてき性能せいのう改善かいぜんはかっており、この大量たいりょうデータを学習がくしゅうできるようになる改善かいぜんは、業界ぎょうかい全体ぜんたい人工じんこう知能ちのうブームがはじまるきっかけとなった[4]。2015ねんまでに、Microsoftの研究けんきゅうしゃは、せまいILSVRCタスクにおいては、CNNの認識にんしき性能せいのう人間にんげん能力のうりょくえたと報告ほうこくした [14][30]。ただし、ILSVRCの主催しゅさいしゃ1人ひとりであるOlga Russakovskyが2015ねん指摘してきしたように、機械きかい学習がくしゅうプログラムは1つの画像がぞうたいして、1000のカテゴリのうち1つにぞくするものであると識別しきべつするだけでいのにたいし、人間にんげんはよりおおくのカテゴリを認識にんしきすることができるし、(プログラムとはことなり)画像がぞう文脈ぶんみゃく判断はんだんすることもできる[31]

2014ねんまでに、のべ80をえる団体だんたいがILSVRCに参加さんかした[32]。 2015ねんにはひゃく研究けんきゅうしゃが、1週間しゅうかんのうちに2かいまでしかモデルを提出ていしゅつできないという制限せいげんを、複数ふくすうのアカウントをもちいることでやぶったとして、1年間ねんかん参加さんかきんじられた[33][34]。そのひゃくは、関与かんよしたチームリーダーを解雇かいこし、エンジニアに助言じょげんする委員いいんかい設置せっちすると発表はっぴょうした[35]

2017ねんには、参加さんかした38チームのうち29チームが95%をえる精度せいど達成たっせいした[36]。こうしたことから、ImageNetももはや深層しんそう学習がくしゅう技術ぎじゅつ進展しんてんはかるベンチマークとしては、データりょうすくないと指摘してきされることもある[37]精度せいど向上こうじょうすす上昇じょうしょう余地よちちいさくなってきたことを理由りゆうに、2017ねん最後さいご終了しゅうりょうすることを発表はっぴょうし、同年どうねん7がつ大会たいかい最後さいごとなった[25]

ImageNetの課題かだい

[編集へんしゅう]

2019ねんおこなわれたImageNetとWordNetにかんする様々さまざま観点かんてん分類ぶんるい体系たいけい物体ぶったいクラス、ラベリング)からの研究けんきゅうにより、ほとんどの画像がぞう分類ぶんるいアプローチにImageNetやWordNetのデータセットのバイアスふかまれていることがしめされている[38][39][40][41]たとえばGoogleの研究けんきゅうしゃは、2020ねんに、ImageNetのラベルをあらたに付与ふよなおしそのデータセットで複数ふくすう画像がぞう認識にんしきアルゴリズムの性能せいのう評価ひょうかしたところ、性能せいのう改善かいぜんする効果こうかがアルゴリズムの作成さくせいしゃ主張しゅちょうするものよりちいさくなったと指摘してきしている[42]同時どうじにアルゴリズムの性能せいのう向上こうじょうが、こうしたImageNetのラベルのあやまりにたいして学習がくしゅうしている可能かのうせい指摘してきしている[42]。また、1つの画像がぞう複数ふくすう物体ぶったいうつっているケースもおおく、それがモデルの性能せいのう影響えいきょうあたえているという指摘してきもある[17]。ImageNetは、こうしたバイアスがしょうじた原因げんいん対処たいしょするためのみをすすめている[43]。 また、ImageNetの画像がぞうがデータ収集しゅうしゅう過程かていかおにぼかしをれていないというプライバシーの問題もんだいもある[44]に、人物じんぶつかお画像がぞうたいするカテゴリに侮蔑ぶべつてき表現ひょうげんふくむものがあったことを2019ねんあきらかにし、そうしたカテゴリを除去じょきょしたデータセットをあらたに公開こうかいするといったデータ作成さくせいじょう課題かだい表出ひょうしゅつしている[45][46]

脚注きゃくちゅう

[編集へんしゅう]

注釈ちゅうしゃく

[編集へんしゅう]
  1. ^ 物体ぶったい周囲しゅうい外接がいせつするような最小さいしょう長方形ちょうほうけいのこと。物体ぶったい検出けんしゅつもちいられる。
  2. ^ モデルが予測よそくした分類ぶんるいカテゴリのうち、測度そくどたか上位じょうい5クラスのどれかが正解せいかい一致いっちしていれば分類ぶんるい成功せいこうしたとみなし、それ以外いがい失敗しっぱいとしたときの認識にんしき失敗しっぱいりつのこと[10]
  3. ^ たとえばもとのImageNetデータベースにはいぬいぬしゅが120カテゴリに分類ぶんるいされているが、ILSVRCではそのうち90カテゴリだけが使つかわれている[28]
  4. ^ たたみニューラルネットワークの概念がいねん自体じたい以前いぜんから提案ていあんされていたが、計算けいさんりょう問題もんだい学習がくしゅうデータの不足ふそく実用じつようされていなかった[16]

出典しゅってん

[編集へんしゅう]
  1. ^ “New computer vision challenge wants to teach robots to see in 3D”. New Scientist. (2017ねん4がつ7にち). https://www.newscientist.com/article/2127131-new-computer-vision-challenge-wants-to-teach-robots-to-see-in-3d/ 2018ねん2がつ3にち閲覧えつらん 
  2. ^ a b Markoff, John (2012ねん11月19にち). “For Web Images, Creating New Technology to Seek and Find”. The New York Times. https://www.nytimes.com/2012/11/20/science/for-web-images-creating-new-technology-to-seek-and-find.html 2018ねん2がつ3にち閲覧えつらん 
  3. ^ ImageNet Summary and Statistics”. ImageNet. 2016ねん6がつ22にち閲覧えつらん
  4. ^ a b c “From not working to neural networking”. The Economist. (2016ねん6がつ25にち). https://www.economist.com/news/special-report/21700756-artificial-intelligence-boom-based-old-idea-modern-twist-not 2018ねん2がつ3にち閲覧えつらん 
  5. ^ a b 斎藤さいとう かんあつしゼロからつくるDeep Learning : Pythonでまなぶディープラーニングの理論りろん実装じっそう』オライリージャパン、東京とうきょう、2016ねん9がつ、249ぺーじISBN 978-4-87311-758-4OCLC 959940370https://www.ohmsha.co.jp/book/9784873117584/ 
  6. ^ a b Russakovsky et al. 2015, p. 4.
  7. ^ a b c Russakovsky et al. 2015, p. 5.
  8. ^ Papers with Code - ImageNet Benchmark (Image Classification)” (英語えいご). paperswithcode.com. 2022ねん10がつ16にち閲覧えつらん
  9. ^ Krizhevsky, Alex; Sutskever, Ilya; Hinton, Geoffrey E. (June 2017). “ImageNet classification with deep convolutional neural networks”. Communications of the ACM 60 (6): 84–90. doi:10.1145/3065386. ISSN 0001-0782. https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf 2017ねん5がつ24にち閲覧えつらん. 
  10. ^ 裕雄ひろお, 片岡かたおかコンピュータビジョンによる動画どうが認識にんしき」『Vision』だい31かんだい1ごう、2019ねん、1ぺーじdoi:10.24636/vision.31.1_1 
  11. ^ a b c d Russakovsky et al. 2015, p. 19.
  12. ^ “Machines 'beat humans' for a growing number of tasks”. Financial Times. (2017ねん11月30にち). https://www.ft.com/content/4cc048f6-d5f4-11e7-a303-9060cb1e5f44 2018ねん2がつ3にち閲覧えつらん 
  13. ^ Gershgorn. “The inside story of how AI got good enough to dominate Silicon Valley”. Quartz. 2018ねん12がつ10日とおか閲覧えつらん
  14. ^ a b He, Kaiming; Zhang, Xiangyu; Ren, Shaoqing; Sun, Jian (2016). “Deep Residual Learning for Image Recognition.”. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR): 770–778. arXiv:1512.03385. doi:10.1109/CVPR.2016.90. ISBN 978-1-4673-8851-1. 
  15. ^ Li Liu (2020). “Deep Learning for Generic Object Detection: A Survey”. International Journal of Computer Vision 128: 265. doi:10.1007/s11263-019-01247-4. 
  16. ^ a b Zhao 2019, p. 3213.
  17. ^ a b Tsipras, Dimitris; Santurkar, Shibani; Engstrom, Logan; Ilyas, Andrew; Madry, A. (2020). “From ImageNet to Image Classification: Contextualizing Progress on Benchmarks”. ICML. https://www.semanticscholar.org/paper/From-ImageNet-to-Image-Classification:-Progress-on-Tsipras-Santurkar/951ddc5c7b50a8e6993b98cf618d956a8ff790a1. 
  18. ^ Yun, Sangdoo; Oh, Seong Joon; Heo, Byeongho; Han, Dongyoon; Choe, Junsuk; Chun, Sanghyuk (2021-06). “Re-labeling ImageNet: from Single to Multi-Labels, from Global to Localized Labels”. 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (Nashville, TN, USA: IEEE): 2340. doi:10.1109/CVPR46437.2021.00237. ISBN 978-1-6654-4509-2. https://ieeexplore.ieee.org/document/9577610/. 
  19. ^ Hempel, Jesse (13 November 2018). “Fei-Fei Li's Quest to Make AI Better for Humanity”. Wired. https://www.wired.com/story/fei-fei-li-artificial-intelligence-humanity/ 2019ねん5がつ5にち閲覧えつらん. 
  20. ^ a b c d Gershgorn (2017ねん7がつ26にち). “The data that transformed AI research—and possibly the world”. Quartz. Atlantic Media Co.. 2017ねん7がつ26にち閲覧えつらん。 “Having read about WordNet's approach, Li met with professor Christiane Fellbaum, a researcher influential in the continued work on WordNet, during a 2006 visit to Princeton.”
  21. ^ Deng, Jia; Dong, Wei; Socher, Richard; Li, Li-Jia; Li, Kai; Fei-Fei, Li (2009), “ImageNet: A Large-Scale Hierarchical Image Database”, 2009 conference on Computer Vision and Pattern Recognition, http://www.image-net.org/papers/imagenet_cvpr09.pdf 
  22. ^ Li, Fei-Fei, How we're teaching computers to understand pictures, https://www.ted.com/talks/fei_fei_li_how_we_re_teaching_computers_to_understand_pictures?language=en 2018ねん12月16にち閲覧えつらん 
  23. ^ Russakovsky et al. 2015, p. 8.
  24. ^ ImageNet Overview”. ImageNet. 2016ねん6がつ22にち閲覧えつらん
  25. ^ a b 日経にっけいRobotics(日経にっけいロボティクス). “日経にっけいRobo》ImageNet後継こうけいコンテスト、中国ちゅうごくベンチャーMalongしゃ世界せかいトップに”. 日経にっけいRobotics(日経にっけいロボティクス). 2022ねん1がつ28にち閲覧えつらん
  26. ^ Russakovsky et al. 2015, p. 1.
  27. ^ Russakovsky et al. 2015, p. 3.
  28. ^ Russakovsky et al. 2015, p. 7.
  29. ^ Robbins, Martin (2016ねん5がつ6にち). “Does an AI need to make love to Rembrandt's girlfriend to make art?”. The Guardian. https://www.theguardian.com/science/2016/may/06/does-an-ai-need-to-make-love-to-rembrandts-girlfriend-to-make-art 2016ねん6がつ22にち閲覧えつらん 
  30. ^ Markoff, John (2015ねん12月10にち). “A Learning Advance in Artificial Intelligence Rivals Human Abilities”. The New York Times. https://www.nytimes.com/2015/12/11/science/an-advance-in-artificial-intelligence-rivals-human-vision-abilities.html 2016ねん6がつ22にち閲覧えつらん 
  31. ^ Aron, Jacob (2015ねん9がつ21にち). “Forget the Turing test – there are better ways of judging AI”. New Scientist. https://www.newscientist.com/article/dn28206-forget-the-turing-test-there-are-better-ways-of-judging-ai/ 2016ねん6がつ22にち閲覧えつらん 
  32. ^ Russakovsky et al. 2015, p. 18.
  33. ^ Markoff, John (2015ねん6がつ3にち). “Computer Scientists Are Astir After Baidu Team Is Barred From A.I. Competition”. The New York Times. https://www.nytimes.com/2015/06/04/technology/computer-scientists-are-astir-after-baidu-team-is-barred-from-ai-competition.html 2016ねん6がつ22にち閲覧えつらん 
  34. ^ “Chinese search giant Baidu disqualified from AI test”. BBC News. (2015ねん6がつ14にち). https://www.bbc.com/news/technology-33005728 2016ねん6がつ22にち閲覧えつらん 
  35. ^ “Baidu fires researcher involved in AI contest flap”. PC World. (2015ねん6がつ11にち). http://www.pcworld.com/article/2935232/baidu-fires-researcher-involved-in-ai-contest-flap.html 2016ねん6がつ22にち閲覧えつらん 
  36. ^ Gershgorn, Dave (2017ねん9がつ10日とおか). “The Quartz guide to artificial intelligence: What is it, why is it important, and should we be afraid?”. Quartz. https://qz.com/1046350/the-quartz-guide-to-artificial-intelligence-what-is-it-why-is-it-important-and-should-we-be-afraid/ 2018ねん2がつ3にち閲覧えつらん 
  37. ^ 中山なかやま英樹ひでき画像がぞう解析かいせき関連かんれんコンペティションの潮流ちょうりゅう」『電子でんし情報じょうほう通信つうしん学会がっかいだい100かんだい5ごう電子でんし情報じょうほう通信つうしん学会がっかい、2017ねん5がつ、(377) 373-380、ISSN 09135693CRID 1520572360426767104 
  38. ^ “The Viral App That Labels You Isn't Quite What You Think”. Wired. ISSN 1059-1028. https://www.wired.com/story/viral-app-labels-you-isnt-what-you-think/ 2019ねん9がつ22にち閲覧えつらん 
  39. ^ Wong, Julia Carrie (2019ねん9がつ18にち). “The viral selfie app ImageNet Roulette seemed fun – until it called me a racist slur”. The Guardian. ISSN 0261-3077. https://www.theguardian.com/technology/2019/sep/17/imagenet-roulette-asian-racist-slur-selfie 2019ねん9がつ22にち閲覧えつらん 
  40. ^ Crawford (2019ねん9がつ19にち). “Excavating AI: The Politics of Training Sets for Machine Learning”. -. 2019ねん9がつ22にち閲覧えつらん
  41. ^ Lyons, Michael (4 September 2020). "Excavating "Excavating AI": The Elephant in the Gallery". arXiv:2009.01215 [cs.CY]。
  42. ^ a b Beyer, Lucas; Hénaff, Olivier J.; Kolesnikov, Alexander; Zhai, Xiaohua; Oord, Aäron van den (2020-06-12). “Are we done with ImageNet?”. arXiv:2006.07159 [cs]. http://arxiv.org/abs/2006.07159. 
  43. ^ Towards Fairer Datasets: Filtering and Balancing the Distribution of the People Subtree in the ImageNet Hierarchy”. image-net.org (2019ねん9がつ17にち). 2019ねん9がつ22にち閲覧えつらん
  44. ^ Yang, Kaiyu; Yau, Jacqueline; Fei-Fei, Li; Deng, Jia; Russakovsky, Olga (2021-03-14). “A Study of Face Obfuscation in ImageNet”. arXiv:2103.06191 [cs]. http://arxiv.org/abs/2103.06191. 
  45. ^ Towards Fairer Datasets: Filtering and Balancing the Distribution of the People Subtree in the ImageNet Hierarchy”. image-net.org. 2022ねん1がつ28にち閲覧えつらん
  46. ^ 巨大きょだい写真しゃしんデータセット「ImageNet」で攻撃こうげきてき差別さべつてきなカテゴリー分類ぶんるいタグけが判明はんめい人物じんぶつ写真しゃしん半数はんすう以上いじょう削除さくじょ”. GIGAZINE. 2022ねん1がつ29にち閲覧えつらん

参考さんこう文献ぶんけん

[編集へんしゅう]

関連かんれん項目こうもく

[編集へんしゅう]


外部がいぶリンク

[編集へんしゅう]