(Translated by https://www.hiragana.jp/)
KataGo - 维基百科,自由的百科全书 とべ转到内容ないよう

KataGo

本页使用了标题或全文手工转换
维基百科ひゃっか自由じゆうてき百科ひゃっかぜん
KataGo
原作げんさくしゃDavid J. Wu[1]
开发しゃDavid J. Wu
くび发布2019ねん2がつ27にち,​5ねんまえ​(2019-02-27[2]
とうぜん版本はんぽん
  • 1.15.3(2024ねん8がつ6にち;稳定版本はんぽん[3]
编辑维基数据链接
原始げんし码库github.com/lightvector/KataGo
编程语言C++Python
类型电脑围棋
许可协议MIT许可证
网站github.com/lightvector/KataGo
KataGo Server
原作げんさくしゃDavid J. Wu and Tycho Tatitscheff[4]
开发しゃDavid J. Wu and Tycho Tatitscheff
くび发布2020ねん11月8にち,​4ねんまえ​(2020-11-08[5]
原始げんし码库github.com/katago/katago-server
编程语言Python
类型电脑围棋
许可协议MIT许可证
网站katagotraining.org

KataGoよしDavid J. Wu(lightvector)しょ研究けんきゅう并开发的いち围棋软件

简介

[编辑]

KataGoDavid J. WuあきらDeepMindてきAlphaGo ZeroあずかAlphaZero论文为基础[6],以及许多ざいDeepMind论文きさきてきしょう研究けんきゅう及原创的研究けんきゅう大幅おおはば改善かいぜんりょう训练速度そくどちょう过50ばい[7]:1[1],也因此搭配所はいしょ发布训练网络资料,なり为目ぜん世界せかいじょう最强さいきょうてき电脑围棋软件いち

KataGoしょ实做てき电脑围棋ほどじょ包括ほうかつりょう[1]

  • 自我じが对弈训练てきほどじょ使用しようC++Python 3あずかTensorFlow实做)
  • 以透过软体操たいそうさくてきGTP引擎(使用しようC++实做)

另外ゆかりJane Street CapitalえいJane Street Capital作者さくしゃ所在しょざいてき公司こうし提供ていきょう运算しょ需资げんがい,也公开发ぬの训练てき成果せいか(训练网络资料)[1]

KataGoいん丰富てき分析ぶんせき能力のうりょくもちいざい围棋ざい线分析ぶんせき网站AI Senseiさく为默认的分析ぶんせき引擎[8]

“KataGo”这个名字みょうじらいげんにち单词“かた (kata)”(类型[9]目前もくぜんそく使つかいざいえいなか武道ぶどうてき形式けいしき也被しょう为“kata”。作者さくしゃ lightvector (David J. Wu) 表示ひょうじ,它作为一个通过强化学习永久训练自己并旨在完成自己的形式的人工じんこう智慧ちえてき名称めいしょう乎是合理ごうりてき

[编辑]

AlphaZero

[编辑]

じょりょう开放原始げんし码与开放资料以外いがい,KataGoあずかAlphaZero主要しゅよう异在于透过研究けんきゅう大幅おおはばくだていりょう初期しょき自我じが训练てき成本なりもと[7]使つかいとく一般家用的高阶电脑可以在数天内,从零训练一个具有中高段水准的业余高手水准的训练网络[1]

Leela Zero

[编辑]

KataGoあずかLeela Zeroてき主要しゅよう异在于,KataGoてきGTP引擎支持しじりょうkata-analyze指令しれい以让ぜんはしてきほどじょぞうLizzie)获取KataGoてきすう分析ぶんせき,这可以辅助人すけっと类棋しゅ判断はんだん,减轻让子棋中くろ棋不かい下出しもいでさいこのみてき选择てき问题[1]

另外いち个差异是KataGoどう支持しじOpenCLv1.2支持しじ[10]あずかCUDA[1]ざいOpenCLじょう最新さいしん版本はんぽん做了优化,さいCUDA版本はんぽんかいすうばい,而是两个版本はんぽん相差おうさつ无几),ただしLeela Zeroただ支持しじOpenCL[11]

强度きょうど

[编辑]

だいいち版本はんぽん

[编辑]

だいいち版本はんぽん(编号g65,v1.0ざい2019ねんがつ使用しよう35颗NVIDIA Tesla V100训练7てん,从6 blocks x 96 filters训练到15 blocks x 192 filters[12]棋力きりょくだい约与LZ130(Leela Zeroてきだい130だいあい[13]だい约是超越ちょうえつじん类的强度きょうど[1]

权重だいごう 版本はんぽん 注解ちゅうかい 训练长度(てん Elo
b6c96-s103408384-d26419149 v1.0 6x96权重 - -
b10c128-s101899520-d60734663 10x128权重 - -
b15c192-s279618816-d164990022 15x192权重 - -

だい版本はんぽん

[编辑]

だい版本はんぽん(编号g104,v1.1ざい2019ねんがつあずかろくがつ使用しよう28颗NVIDIA Tesla V100训练,从6 blocks x 96 filters训练到20 blocks x 256 filters[14]ゆかり于大はば改善かいぜんりょうちょうさんすうhyperparameters),ただ使用しようりょう3.5てん超越ちょうえつだいいちはんてき棋力きりょく[1][15],另外引入りょうLCB(えい语:Lower confidence bound大幅おおはばひさげますりょう棋力きりょく[15]さいきさき训练りょう19てん产生20 blocksてき版本はんぽん棋力きりょくちょうこしりょうLZ-ELFv2(ELF OpenGoてきv2权重はいじょうLeela Zeroてきほどじょ),另外あずかLeela Zero 40 blocks版本はんぽんてき较,だい约落ざいLZ200てき棋力きりょく[1]

权重だいごう 版本はんぽん 注解ちゅうかい 训练长度(てん Elo
g104-b6c96-s97778688-d23397744 v1.1 さいきさきいち个6x96权重 0.75 -1146
g104-b10c128-s110887936-d54937276 さいきさきいち个10x128权重 1.75 -476
g104-b15c192-s297383936-d140330251 さいきさきいち个15x192权重 7.5 327
g104-b20c256-s447913472-d241840887 さいきさきいち个20x256权重 19 908

だいさん版本はんぽん

[编辑]

だい三个版本的训练一开始使用29个GPUいただい14てんきさき增加ぞうか为37个GPU,さい24てんきさき(38てん增加ぞうか为47个GPU[1]

v1.5.0[16]开始支持しじ纯CPU运算(使用しようEigenえいEigen (C++ library)函数かんすう库)。并自v1.8.0はん开始支持しじ分布ぶんぷしき训练,まこと许全だまてきよう户一おこり训练权重。

权重だいごう 版本はんぽん 注解ちゅうかい 训练长度(てん Elo
g170-b6c96-s175395328-d26788732 さいきさきいち个6x96てき权重 0.75 -1184
g170-b10c128-s197428736-d67404019 さいきさきいち个10x128てき权重 1.75 -280
g170e-b10c128-s1141046784-d204142634 v1.3 延伸えんしんさい训练10x128てき权重 - 300
g170-b20c256x2-s668214784-d222255714 20x256てき权重 15.5 959
g170-b15c192-s497233664-d149638345 15x192てき权重 7.5 512
g170-b20c256x2-s1039565568-d285739972 v1.3.1 20x256てき权重 21.5 1073
g170e-b15c192-s1305382144-d335919935 v1.3.1-nets 延伸えんしん训练15x192てき权重 - 867
g170-b20c256x2-s1420141824-d350969033 20x256てき权重 27.5 1176
g170e-b15c192-s1672170752-d466197061 v1.3.2 延伸えんしん训练15x192てき权重 - 935
g170-b20c256x2-s1913382912-d435450331 20x256てき权重 35.5 1269
g170-b20c256x2-s2107843328-d468617949 20x256てき权重 38.5 1293
g170e-b20c256x2-s2430231552-d525879064 v1.3.3 20x256てき权重 47.5 1346
g170-b30c320x2-s1287828224-d525929064 30x320てき权重 47.5 1412
g170-b40c256x2-s1349368064-d524332537 40x256てき权重 47 1406
g170e-b20c256x2-s2971705856-d633407024 v1.3.3-nets 20x256てき权重 64.5 1413
g170-b30c320x2-s1840604672-d633482024 30x320てき权重 1524
g170-b40c256x2-s1929311744-d633132024 40x256てき权重 1510
g170e-b20c256x2-s3354994176-d716845198 v1.3.4 20x256てき权重 78 1455
g170-b30c320x2-s2271129088-d716970897 30x320てき权重 1551
g170-b40c256x2-s2383550464-d716628997 40x256てき权重 1554
g170e-b20c256x2-s3761649408-d809581368 v1.3.5-nets 20x256てき权重 92 1513
g170-b30c320x2-s2846858752-d829865719 30x320てき权重 96 1619
g170-b40c256x2-s2990766336-d830712531 40x256てき权重 1613
g170e-b20c256x2-s4384473088-d968438914 v1.4.0 20x256てき权重 117 1529
g170-b30c320x2-s3530176512-d968463914 30x320てき权重 1643
g170-b40c256x2-s3708042240-d967973220 40x256てき权重 1687
g170e-b20c256x2-s4667204096-d1045479207 20x256てき权重(实验せい 129 1561
g170-b30c320x2-s3910534144-d1045712926 30x320てき权重(实验せい 1651
g170-b40c256x2-s4120339456-d1045882697 40x256てき权重(实验せい 1698
g170e-b20c256x2-s4842585088-d1091433838 20x256てき权重(实验せい 136.5 1547
g170-b30c320x2-s4141693952-d1091071549 30x320てき权重(实验せい 1653
g170-b40c256x2-s4368856832-d1091190099 40x256てき权重(实验せい 1680
g170e-b20c256x2-s5055114240-d1149032340 v1.4.2-nets 20x256てき权重(实验せい[ちゅう 1] 145.5 1539
g170-b30c320x2-s4432082944-d1149895217 30x320てき权重(实验せい[ちゅう 1] 1648
g170-b40c256x2-s4679779328-d1149909226 40x256てき权重(实验せい[ちゅう 1] 1690
g170e-b20c256x2-s5132547840-d1177695086 20x256てき权重 150 1577
g170-b30c320x2-s4574191104-d1178681586 30x320てき权重 1759
g170-b40c256x2-s4833666560-d1179059206 40x256てき权重 1788
g170e-b20c256x2-s5303129600-d1228401921 v1.4.5 20x256てき权重 157 1645
g170-b30c320x2-s4824661760-d1229536699 30x320てき权重 1908
g170-b40c256x2-s5095420928-d1229425124 40x256てき权重 1919

あい关链せっ

[编辑]

参考さんこう资料

[编辑]
  1. ^ 1.00 1.01 1.02 1.03 1.04 1.05 1.06 1.07 1.08 1.09 1.10 lightvector. GTP engine and self-play learning in Go. GitHub. lightvector/KataGo. [2020-01-01]. (原始げんし内容ないようそん于2021-01-14) えい语). 
  2. ^ lightvector. TensorRT Backend, Many Minor Improvements. GitHub. lightvector/KataGo. [2020-01-01]. (原始げんし内容ないようそん于2021-01-26) えい语). 
  3. ^ Release 1.15.3. 2024ねん8がつ6にち [2024ねん8がつ22にち]. 
  4. ^ lightvector. katago/katago-server. GitHub. [2021-01-14]. (原始げんし内容ないようそん于2020-11-19). 
  5. ^ lightvector. v0.1. GitHub. katago/katago-server. 2020-11-08 [2021-01-14]. (原始げんし内容ないようそん于2020-11-19) えい语). 
  6. ^ David Wu. Accelerating Self-Play Learning in Go. TECH BLOG. Jane Street. 2019-02-28 [2020-01-01]. (原始げんし内容ないようそん于2020-11-07) えい语). 
  7. ^ 7.0 7.1 David J. Wu. Accelerating Self-Play Learning in Go. 2020-11-09. arXiv:1902.10565v4可免费查阅 [cs.LG]. 
  8. ^ bsteuber. Analyze with a fixed visit number?. GitHub. lightvector/KataGo. 2019-12-19 [2022-01-09]. (原始げんし内容ないようそん于2020-10-30) えい语). 
  9. ^ lightvector. The Name of KataGo. GitHub. lightvector/KataGo. 2020-08-27 [2022-01-09]. (原始げんし内容ないようそん档于2022-01-09) えい语). 
  10. ^ lightvector. OpenCL, Windows Support, other features and fixes. GitHub. lightvector/KataGo. 2019-07-21 [2020-05-12]. (原始げんし内容ないようそん于2020-10-30) えい语). 
  11. ^ MaxVanDijck. Go engine with no human-provided knowledge, modeled after the AlphaGo Zero paper.. GitHub. leela-zero/leela-zero. [2020-01-02]. (原始げんし内容ないようそん于2021-01-06) えい语). 
  12. ^ katago-public/g65/models. [2020-01-01]. (原始げんし内容ないようそん档于2020-01-01). 
  13. ^ lightvector. Initial release. GitHub. lightvector/KataGo. 2019-02-27 [2020-01-14]. (原始げんし内容ないようそん于2020-10-30) えい语). 
  14. ^ katago-public/g104/models. [2020-01-01]. (原始げんし内容ないようそん档于2020-01-01). 
  15. ^ 15.0 15.1 lightvector. Strong Neural Net, LCB, and many bugfixes. GitHub. lightvector/KataGo. 2019-06-18 [2020-01-14]. (原始げんし内容ないようそん于2020-10-30) えい语). 
  16. ^ lightvector. OpenCL FP16 Tensor Core Support. GitHub. lightvector/KataGo. 2020-08-03 [2020-08-26]. (原始げんし内容ないようそん于2020-10-30) えい语). 
  17. ^ lightvector. Experimental Neural Nets. GitHub. lightvector/KataGo. 2020-06-06 [2020-06-07]. (原始げんし内容ないようそん于2020-10-30) えい语). 

注解ちゅうかい

[编辑]
  1. ^ 1.0 1.1 1.2 实验せい质,加入かにゅうりょうじん类的棋谱,未必みひつかいv1.4.0しょ提供ていきょうてき网络きょう[17]

外部がいぶ链接

[编辑]