(Translated by https://www.hiragana.jp/)
AdaBoost - Wikipedia コンテンツにスキップ

AdaBoost

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

AdaBoost(Adaptive Boosting、エイダブースト、アダブースト)は、Yoav FreundRobert Schapire によって考案こうあんされた[1]機械きかい学習がくしゅうアルゴリズムである。メタアルゴリズムであり、おおくの学習がくしゅうアルゴリズムとわせて利用りようすることで、そのパフォーマンスを改善かいぜんすることができる。AdaBoost はまえ分類ぶんるい間違まちがいにおうじて調整ちょうせいされたつぎ分類ぶんるいつくるという意味いみ適応てきおうてき (Adaptive) である。AdaBoost はノイズのおおいデータや異常いじょう影響えいきょうける。しかし、いくつかの場面ばめんでは、おおくの学習がくしゅうアルゴリズムより過剰かじょう適合てきごう影響えいきょうけにくい。

AdaBoost は、それぞれの標本ひょうほんたいし、じゃく分類ぶんるい英語えいごばん を、 から までじゅん適用てきようし、それぞれの分類ぶんるい正解せいかいしたかかを判断はんだんする。間違まちがって分類ぶんるいされた標本ひょうほん対応たいおうするおも は、よりおもくされる(あるいは、まさしく分類ぶんるいされた標本ひょうほん場合ばあいは、おもみをらす)。これらの標本ひょうほんたいするおもみから、つぎの t のループではただしい分類ぶんるいはやさがこと出来できる。

分類ぶんるいのアルゴリズム

[編集へんしゅう]

Given: where

Initialize

For :

  • Find the classifier that minimizes the error with respect to the distribution :
, where
  • if then stop.
  • Choose , typically where is the weighted error rate of classifier .
  • Update:

where is a normalization factor (chosen so that will be a probability distribution, i.e. sum one over all x).

Output the final classifier:

The equation to update the distribution is constructed so that:

Thus, after selecting an optimal classifier for the distribution , the examples that the classifier identified correctly are weighted less and those that it identified incorrectly are weighted more. Therefore, when the algorithm is testing the classifiers on the distribution , it will select a classifier that better identifies those examples that the previous classifer missed.

ブースティングの統計とうけいてき理解りかい

[編集へんしゅう]

ブースティングはとつ集合しゅうごう関数かんすうじょうかんするとつ損失そんしつ関数かんすう最小さいしょうとみなすことができる[2]とくに、損失そんしつ関数かんすう最小さいしょうするために指数しすう関数かんすう損失そんしつ関数かんすう:

および関数かんすうたいして探索たんさくおこなう:

もちいる。

関連かんれん項目こうもく

[編集へんしゅう]

脚注きゃくちゅう

[編集へんしゅう]
  1. ^ Yoav Freund, Robert E. Schapire (1995ねん). “A Decision-Theoretic Generalization of on-Line Learning and an Application to Boosting”. 2010ねん7がつ9にち閲覧えつらん
  2. ^ T. Zhang, "Convex Risk Minimization", Annals of Statistics, 2004.

外部がいぶリンク

[編集へんしゅう]
  • icsiboost, an open source implementation of Boostexter
  • NPatternRecognizer , a fast machine learning algorithm library written in C#. It contains support vector machine, neural networks, bayes, boost, k-nearest neighbor, decision tree, ..., etc.