(Translated by https://www.hiragana.jp/)
隨機控制 - 维基百科,自由的百科全书 とべ转到内容ないよう

ずいひかえせい

维基百科ひゃっか自由じゆうてき百科ひゃっかぜん

ずいひかえせい(stochastic control)あるずいさい优控せい(stochastic optimal control)これひかえせいなかてきいち領域りょういきはりたいゆう確定かくていせいてき系統けいとう進行しんこうひかえせい確定かくていせい可能かのうざいりょうはかじょう也有やゆう可能かのういんためざつてき影響えいきょう系統けいとう設計せっけいしゃかい假設かせつ影響えいきょう狀態じょうたい變數へんすうてきずいざつ訊,(以贝叶斯概りつてき觀點かんてんらい)其機りつ分布ぶんぷやめ知的ちてきずいひかえせいてき目的もくてきざいざつ存在そんざいてきじょうがた設計せっけい受控變數へんすうてき時間じかん軌跡きせきざい最小さいしょう成本なりもとてきじょうがた(其成ほん可能かのうかいてきゆう適當てきとうてき定義ていぎ使つかい系統けいとう完成かんせいあずかてきひかえせい任務にんむ[1]ずいひかえせい可能かのう配合はいごう離散りさん時間じかん系統けいとう,也可能かのう連續れんぞく時間じかん系統けいとう

確定かくていせいとうこう

[编辑]

ずいひかえせいちゅうさいつねさがせ討的ひかえせいせんせい平方へいほうだか斯控せい(LQGひかえせい),其模がたためせん性的せいてき目標もくひょう函數かんすうてきもち值為せい,而擾どうじゅんたたみせいてきわか離散りさん時間じかん集中しゅうちゅうしき系統けいとう,其不確定かくていせいじゅんたたみせいゆういち基本きほんてき特性とくせいため確定かくていせいとうこう性質せいしつ」(certainty equivalence property)[2]:其最けいひかえせいてきかいぼつゆうたたみせい擾動てきかいいちよう所有しょゆうせんせい系統けいとうかたほど目標もくひょう函數かんすうざつ訊為じゅんたたみせいてき集中しゅうちゅうしき系統けいとうちゅう確定かくていせいとうこう性質せいしつ都會とかい成立せいりつ,二次目標函數的假設是讓(配合はいごう確定かくていせいとうこう性質せいしつてきさいけいひかえせいりつひかえせい觀測かんそく值的せんせい函數かんすう

わかゆうにんなん上述じょうじゅつ假設かせつ不同ふどうてき地方ちほうせんせい狀態じょうたいかたほど目標もくひょう函數かんすう乘數じょうすう確定かくていせいえいMultiplier uncertaintyある系統けいとうため分散ぶんさんしきひかえせい系統けいとう都會とかいゆずる確定かくていせいとうこう性質せいしつ不成立ふせいりつれい如在分散ぶんさんしき系統けいとうちゅうてきWitsenhausen反例はんれい就是說明せつめい確定かくていせいとうこう性質せいしつざい分散ぶんさんしき系統けいとうちゅう不成立ふせいりつ

離散りさん時間じかん系統けいとう

[编辑]

ざい離散りさん時間じかん系統けいとうちゅうひかえせいかいざいまい時間じかんしゅう觀測かんそく狀態じょうたい變數へんすう(也可能かのう包括ほうかつ估測ざつ訊)。其目標もくひょう以針たい所有しょゆう時間じかん內的せんせい可能かのうてき目標もくひょう函數かんすう計算けいさん不同ふどう時間じかんもち值的けん,也可以只はりたい最後さいご時間じかんてき目標もくひょう函數かんすう進行しんこうさいけいまい時間じかん區間くかん內會さん生新せいしんてき估測值,さいけいてき方式ほうしき調整ちょうせいひかえせい變數へんすう。找目ぜん時間じかんさいけいかいてき作法さほう後向うしろむき迭代計算けいさんせんせい平方へいほうだか斯控せいのりじんRiccatiかたほど),したがえ最後さいごてき時間じかん一直倒退迭代到目前時間。

考慮こうりょ離散りさん時間じかん系統けいとう,其傳遞矩じんあるひかえせいひびきおうのり陣中じんちゅうてきまいりすうゆう確定かくていせいいん狀態じょうたい變數へんすうてき目前もくぜん值會ゆう變化へんか),ただし仍然せんせい狀態じょうたい函數かんすう以及せい目標もくひょう函數かんすう,仍然以用ごといち時間じかんしゅうてきかい用後ようごこう迭代てき方式ほうしきもとめかいRiccatiかたほど可能かのうぼつゆう確定かくていせいとうこうてき特性とくせい[2]ch.13[3]わか離散りさん時間じかん系統けいとうてき目標もくひょう函數かんすうせいてきただしこれただよう處理しょりせい確定かくていせい,也可以進行しんこうずいひかえせいかい比較ひかく複雜ふくざつ[4]

れい

[编辑]

以下いか一個典型的離散時間隨機線性二次控制問題,よう最小さいしょう[2]:ch. 13;[3][5]

其中E1ためざいy0條件下じょうけんかてきもち運算うんざんうえしるべT表示ひょうじ转置のりSため時間じかん區間くかん,其狀態じょうたいかたほど如下

其中yこれn × 1てき觀察かんさつ狀態じょうたい變數へんすうむこうりょうuこれk × 1てきひかえせい變數へんすうむこうりょうAt時間じかんtどきてきずいn × n狀態じょうたい轉移てんいのりじんてき實現じつげんBt時間じかんtどきてきずいn × kひかえせい乘數じょうすうのりじんてき實現じつげんQ (n × n)R (k × k)やめ知的ちてきただしてい費用ひようのりじん假設かせつABまとごと元素げんそざい時間じかんじょう聯合れんごうてき独立どくりつどう分布ぶんぷいん此期もち運算うんざん不用ふよう考慮こうりょ時間じかんてき條件じょうけん

以用かいなんじ曼方ほどいたまい時間じかんてきさいけいひかえせいかい[2]:ch. 13

配合はいごう對稱たいしょうただしていcost-to-goのりじんXしたがえ開始かいし,以倒退すさ時間じかん方式ほうしき迭代,方程式ほうていしきため

這個就是此問題もんだい離散りさん時間じかんてき動態どうたいRiccatiかたほどゆうせきのりじんABちゅう未知みちさんすうしょ需要じゅよう知道ともみちてき訊只ゆうごとのりちゅうまい元素げんそてきもち值、かたどうのりじん不同ふどう元素げんそてききょう變異へんいすう,以及不同ふどうのりじん中元ちゅうげん素的すてきども變異へんいすう

わかざい狀態じょうたいかたほど中有ちゅうう平均へいきん值為0、獨立どくりつ且相どうぶん(i.i.d.)てきせい擾動出現しゅつげんただようのりじんABてき元素げんそぼつゆう關係かんけい,此擾どうかい影響えいきょうさいかたほどかり如擾どうのりじんゆうせきまい時間じかんてきさいけいひかえせいかいかい包括ほうかつがく外的がいてきせい常數じょうすうむこうりょうわかせい常數じょうすうむこうりょう出現しゅつげんざい狀態じょうたいかたほどちゅうのりごと時間じかんてきさいけいひかえせいかいかいさい包括ほうかつがく外的がいてきせい常數じょうすうむこうりょう

Xてき穩態特徵とくちょうわか存在そんざいかいS延伸えんしんいた無限むげんだいてきてき無限むげん時間じかん問題もんだい相關そうかん以用おもくつがえ迭代動態どうたいかたほどなかてきX,一直到收斂為止來計算,此時てき動態どうたいかたほどなかてきX就不ようゆうせき時間じかんてきしめぎりょう

連續れんぞく時間じかん

[编辑]

わか模型もけい連續れんぞく時間じかんてき系統けいとうひかえせい知道ともみち系統けいとうざいまいいち時間じかんてき狀態じょうたい。其目標もくひょう可能かのう最大さいだい狀態じょうたい變數へんすう凹函すう(Concave Function)てきざい時間じかん區間くかん0いた最後さいご時間じかんTあいだてき積分せきぶんずいちょ時間じかんてきえんじすすむかい持續じぞくてき觀測かんそくいたしんてき值,也會さいけいてき方式ほうしきらい調整ちょうせいひかえせい變數へんすう

ずい模型もけいあずかはかひかえせい

[编辑]

ざい文獻ぶんけんちゅうゆう二種隨機系統的模型預測控制:強健きょうけん模型もけいあずかはかひかえせい(Robust model predictive control)及隨模型もけいあずかはかひかえせい(Stochastic Model Predictive Control,SMPC)。強健きょうけん模型もけいあずかはかひかえせい保守ほしゅてき方式ほうしきざいさいけい過程かていちゅうかい考慮こうりょさいてきじょうがた此方こちらしき其他強健きょうけんひかえせい類似るいじかいゆずるせいひかえせいてき性能せいのうへんただ適用てきよう確定かくていせい有明ありあけかく範圍はんいざい系統けいとう。而隨模型もけいあずかはかひかえせいよう軟性なんせいてききりせいようりつてき不等式ふとうしきらいゆずる違反いはんげんせいてきりつかい超過ちょうか一定いってい範圍はんい[6]

金融きんゆうてき應用おうよう

[编辑]

ざい金融きんゆう領域りょういき連續れんぞく系統けいとうてき研究けんきゅうちゅうずい微分びぶんかたほどてき狀態じょうたいへん數多あまたはんざいとみあるきよし值,ひかえせい變數へんすう不同ふどう時間じかんかく資產しさんてき配置はいちじょうがたきゅうていにんいちあいだてき資產しさん配置はいちざいとみ變化へんかてき決定けっていいんもと資產しさんてきずい收益しゅうえき以及無風むふうけん資產しさんてき利率りりつずいひかえせいてき領域りょういきざい1970年代ねんだい開始かいし大幅おおはば發展はってんゆうしょうひと應用おうようざい金融きんゆうじょう。Robert Mertonようずいひかえせいらい研究けんきゅう安全あんぜん資產しさん以及ふうけん資產しさんてきさいけい投資とうし組合くみあいえいoptimal portfolio[7]Merton投資とうし組合くみあい問題もんだいえいMerton's portfolio problem以及ぬの莱克-舒尔兹模がた改變かいへんりょう金融きんゆう文獻ぶんけんてき特質とくしつゆう影響えいきょうりょくてき相關そうかん數學すうがく教科書きょうかしょ包括ほうかつWendell FlemingFlemingえいWendell FlemingRishelごうちょてき教科書きょうかしょ[8]、以及FlemingSonerえいHalil Mete Sonerごうちょてき教科書きょうかしょ[9]Jerome Steinはた這些技巧ぎこう應用おうようざい2007ねん–2008ねんたまきだま金融きんゆう危機きき[10]

ざい最後さいごTてききよし值期もち值對すうてき最大さいだい值,ざいとみなり份的ずい過程かていゆうせきざい連續れんぞく系統けいとうちゅう伊藤いとう引理主要しゅよう分析ぶんせき工具こうぐわかようさがせ討在時間じかん(0,T)內凹函數かんすう積分せきぶんてき最大さいだい值,かい使用しよう動態どうたいぶんまわし劃。這裡ぼつゆう類似るいじ較舊てき文獻ぶんけんてき確定かくていとうこう關係かんけいいんためひかえせい變數へんすうてき係數けいすうところせん資產しさん份額しょ獲得かくとくてき回報かいほう)也是ずい性的せいてき

相關そうかん條目じょうもく

[编辑]

参考さんこう文献ぶんけん

[编辑]
  1. ^ Definition from Answers.com. [2018-09-05]. (原始げんし内容ないようそん于2019-03-31). 
  2. ^ 2.0 2.1 2.2 2.3 Chow, Gregory P. Analysis and Control of Dynamic Economic Systems. New York: Wiley. 1976. ISBN 0-471-15616-7. 
  3. ^ 3.0 3.1 Turnovsky, Stephen. Optimal Stabilization Policies for Stochastic Linear Systems: The Case of Correlated Multiplicative and Additive disturbances. Review of Economic Studies. 1976, 43 (1): 191–94. doi:10.2307/2296614. 
  4. ^ Mitchell, Douglas W. Tractable Risk Sensitive Control Based on Approximate Expected Utility. Economic Modelling. 1990, 7 (2): 161–164. doi:10.1016/0264-9993(90)90018-Y. 
  5. ^ Turnovsky, Stephen. The stability properties of optimal economic policies. American Economic Review. 1974, 64 (1): 136–148. JSTOR 1814888. 
  6. ^ Hashemian; Armaou. Stochastic MPC Design for a Two-Component Granulation Process. IEEE Proceedings. 2017: 4386–4391. Bibcode:2017arXiv170404710H. arXiv:1704.04710可免费查阅. 
  7. ^ Merton, Robert. Continuous Time Finance. Blackwell. 1990. 
  8. ^ Fleming, W.; Rishel, R. Deterministic and Stochastic Optimal Control. 1975 [2018-10-01]. ISBN 0-387-90155-8. (原始げんし内容ないようそん于2021-04-28). 
  9. ^ Fleming, W.; Soner, M. Controlled Markov Processes and Viscosity Solutions. Springer. 2006. 
  10. ^ Stein, J. L. Stochastic Optimal Control and the US Financial Crisis. Springer-Science. 2012.