大型おおがた语言模型もけい

人工じんこう智能ちのう模型もけい型式けいしき
上うえ级分类	語かたり言げん模型もけい
用途ようと	对话型がたAI
话题方面ほうめん	人工じんこう智能ちのう
简称	LLM
详情描述网址	https://www.youtube.com/watch?v=WqYBx2gB6vA
使用しよう	AI提示ていじ、变换器き
EntitySchema for this class	Entity schema not supported yet (E434)
相對そうたい概念がいねん	小型こがた语言模型もけい

大だい语言模型もけい（英語えいご：large language model，LLM）是ぜ一いち种语言げん模型もけい，由よし具有ぐゆう许多参さん数すう（通常つうじょう数すう十亿个权重或更多）的てき人工じんこう神しん经网络组成，使用しよう自じ监督学がく习或ある半はん监督学がく习对大量りょう未み标记文ぶん本ほん进行训练^[1]。大だい语言模型もけい在ざい2018年ねん左右さゆう出で现，并在各かく种任务中表ひょう现出色しょく^[2]。

尽つき管かん这个术语没ぼつ有ゆう正式せいしき的てき定てい义，但ただし它通常つうじょう指ゆび的てき是ぜ参さん数すう数量すうりょう在ざい数すう十亿或更多数量级的深度しんど学がく习模型もけい^[3]。大だい语言模型もけい是ぜ通用つうよう的てき模型もけい，在ざい广泛的てき任にん务中表ひょう现出色しょく，而不是ぜ针对一项特定任务（例れい如情感かん分析ぶんせき、命名めいめい实体识别或ある数学すうがく推理すいり）进行训练^[2]。

尽つき管かん大だい语言模型もけい仅在预测句く子中こなか的てき下か一个单词等简单任务上接受过训练，但ただし发现具有ぐゆう足あし够训练和参さん数すう计数的てき神かみ经语言げん模型もけい可か以捕获人类语言げん的てき大だい部分ぶぶん句法くほう和わ语义。此外大だい语言模型もけい还展示てんじ了りょう相当そうとう多おお的てき关于世界せかい的てき常つね识，并且能のう够在训练期き间“记住”大量たいりょう事ごと实^[2]。

虽然 ChatGPT 为代表だいひょう的てき大だい语言模型もけい在ざい生成せいせい类人文じんぶん本ほん方面ほうめん表ひょう现出了りょう卓越たくえつ的てき能力のうりょく，但ただし它们很容易ようい继承和わ放ひ大だい训练数すう据すえ中ちゅう存在そんざい的てき偏差へんさ。这可能かのう表ひょう现为对不同どう人口じんこう统计数すう据すえ的てき歪曲わいきょく表ひょう述じゅつ或ある不公平ふこうへい待遇たいぐう，例れい如基于种族ぞく^[4]、性せい别^[5]、语言^[6]和かず文化ぶんか群ぐん体からだ^[6]的てき不同ふどう观点与あずか态度。

偏差へんさ和わ局限きょくげん性せい

大だい语言模型もけい偏差へんさ和わ局限きょくげん性せい是ぜ自然しぜん语言处理（NLP）领域正ただし在ざい进行的てき研究けんきゅう。虽然大だい语言模型もけい在ざい生成せいせい类人文じんぶん本ほん方面ほうめん表ひょう现出了りょう卓越たくえつ的てき能力のうりょく，但ただし他た们很容易ようい继承和わ放ひ大だい训练数すう据すえ中ちゅう存在そんざい的てき偏へん见。这可能かのう表ひょう现为对不同どう人口じんこう统计数すう据すえ的てき不公平ふこうへい待遇たいぐう，例れい如基于种族ぞく、性せい别、语言和わ文化ぶんか群ぐん体からだ的てき统计数すう据すえ。此外，这些模型もけい通常つうじょう面めん临事实准确性的てき限きり制せい。研究けんきゅう和わ缓解这些偏へん见和限げん制せい对于人工じんこう智能ちのう在ざい不同ふどう社会しゃかい和わ专业领域的てき道德どうとく发展和わ应用至いたり关重要じゅうよう。

语言偏差へんさ

语言偏差へんさ是ぜ指ゆび与あずか语言相しょう关的一种统计抽样偏差，也就是ぜ说在信しん息いき抽样中ちゅう，查询语言导致的てき系けい统偏差さ会かい使し其无法ほう准じゅん确呈现数据すえ中ちゅう的てき各かく种不同どう主しゅ题和观点。当とう前まえ的てき大型おおがた语言模型もけい主要しゅよう是ぜ根ね据すえ英えい语数据すえ进行训练的てき，因いん此通常つうじょう将はた英えい语观点てん视为真ま实可靠もたれ的てき观点，而系统地将はた非ひ英えい语观点てん视为不ふ相あい关、错误或ある噪音。当とう被ひ问到诸如“什么是ぜ自由じゆう主ぬし义？”之の类的政治せいじ意い识形态的问题时，ChatGPT以英美び角度かくど为中心ちゅうしん，而对例れい如说越えつ南みなみ的てき“反はん对国家こっか干ひ预个人じん和わ经济生活せいかつ”与あずか中国ちゅうごく的てき“限きり制せい政府せいふ权力”等とう视而不ふ见。同どう样，回かい复中也没有ゆう日本にっぽん、韩国、法ほう国こく和德わとく国こく语料库中的てき主流しゅりゅう政治せいじ观点。^[6]

性せい别偏差さ

性せい别偏差さ是ぜ指ゆび这些模型もけい产生的てき结果倾向于对一种性别产生不公平的偏见。这种偏差へんさ通どおり常つね源みなもと于训练这些模型がた的てき数すう据すえ。例れい如，大型おおがた语言模型もけい通常つうじょう根ね据すえ传统的てき性せい别规范来分配ぶんぱい角かく色しょく和わ特とく征せい；它可能会のうかい将はた护士或ある秘ひ书主要しゅよう与あずか女性じょせい联系起おこり来らい，将はた工程こうてい师或首席しゅせき执行官かん与あずか男性だんせい联系起おこり来らい。^[4]^[7]

政治せいじ偏差へんさ

政治せいじ偏差へんさ是ぜ指ゆび算法さんぽう系けい统地倾向于某些政治せいじ观点、意い识形态或结果，也可能かのう表ひょう现出政治せいじ偏へん见。由よし于训练数据すえ包含ほうがん广泛的てき政治せいじ观点和わ覆くつがえ盖范围，因いん此模型がた可能かのう会かい生成せいせい倾向于特定とくてい政治せいじ意い识形态或观点的てき响应，具体ぐたい取と决于数すう据すえ中ちゅう这些观点的てき普遍ふへん程度ていど。^[8]

文化ぶんか偏差へんさ

文化ぶんか偏へん见是指ゆび大だい语言模型もけい对特定とくてい的てき文化ぶんか实践、信仰しんこう或ある传统持じ有ゆう偏へん见，由ゆかり于受到训练数すう据すえ中ちゅう文化ぶんか信しん息いき的てき不ふ均衡きんこう、误导性せい或ある歧视性せい影かげ响。例れい如，若わか模型もけい的てき训练数すう据すえ中ちゅう某ぼう种文化ぶんか的てき观点被ひ过度代表だいひょう，模型もけい就继承这种偏差へんさ形成けいせい一定いってい的てき偏へん见。^[9]

地域ちいき偏差へんさ

地域ちいき偏差へんさ是ぜ指ゆび大だい语言模型もけい根ね据すえ地理ちり位置いち或ある国籍こくせき对人们的行ぎょう为、习惯或ある特とく征せい做出偏へん见性的てき假かり设。这种偏差へんさ可能かのう导致对特定とくてい地区ちく的てき知ち识、成就じょうじゅ、问题、潜せん力りょく等とう方面ほうめん的てき误解、低てい估或过度放ひ大だい。^[10]

年とし龄偏差さ

年とし龄偏差さ是ぜ指ゆび大だい语言模型もけい在ざい处理或ある生成せいせい与あずか年とし龄相关的话题时，根ね据すえ年ねん龄做出で刻こく板ばん印象いんしょう化か的てき假かり设，例れい如认为年长者不ふ懂技术或年ねん轻人缺乏けつぼう责任感かん。^[11]

职业偏差へんさ

职业偏差へんさ是ぜ指ゆび大だい语言模型もけい对特定とくてい职业持じ有ゆう刻こく板ばん印象いんしょう，将はた某ぼう些职业视为比其他职业更さら有ゆう价值或ある重要じゅうよう，或ある对特定とくてい职业的てき人ひと群ぐん做出性格せいかく或ある能力のうりょく上じょう的てき假かり设。^[12]

大型おおがた语言模型もけい列れつ表ひょう

GPT（OpenAI）
GPT-3（OpenAI）
GPT-4（OpenAI）
LaMDA（谷たに歌か）
PaLM（谷たに歌か）（英えい语：PaLM）
Gemini（谷たに歌か）
Claude（Anthropic）
LLaMA（Meta）
Titan（亞あ馬ば遜へりくだ）
Mistral（Mistral AI）
BLOOM（Hugging Face）
文ぶん心こころ一言ひとこと（百ひゃく度ど）
通義みちよし千せん問もん（阿おもね里さと雲くも）
混こん元もと（騰あが訊）
盤ばん古いにしえ（華はな為ため）
星ほし火ひ（科か大だい訊飛）
商量しょうりょう SenseChat（商しょう湯ゆ科技かぎ）
百川ももかわ（百川ももかわ智能ちのう）
豆まめ包つつみ（抖音）

參まいり見み

外部がいぶ连接

Open LLM Leaderboard（开放LLM排はい行ぎょう榜旨在ざい跟踪、排はい名和なわ评估开放LLM和わ聊天机つくえ器き人じん）（页面存そん档备份，存そん于互联网档案あん馆）
最さい全ぜん大だい语言模型もけい--偏へん见测评测评汇集しゅう https://blog.sciencenet.cn/blog-3429562-1426223.html

参考さんこう资料

^ Goled, Shraddha. Self-Supervised Learning Vs Semi-Supervised Learning: How They Differ. Analytics India Magazine. May 7, 2021 [2023-06-08]. （原始げんし内容ないよう存そん档于2023-06-18）.
^ ^2.0 ^2.1 ^2.2 Manning, Christopher D. Human Language Understanding & Reasoning. Daedalus. 2022, 151 (2): 127–138 [2023-06-08]. S2CID 248377870. doi:10.1162/daed_a_01905. （原始げんし内容ないよう存そん档于2023-03-09）.
^ Carlini, Nicholas; Tramer, Florian; Wallace, Eric; Jagielski, Matthew; Herbert-Voss, Ariel; Lee, Katherine; Roberts, Adam; Brown, Tom B; Song, Dawn; Erlingsson, Ulfar. Extracting Training Data from Large Language Models (PDF). USENIX Security Symposium 6. 2021 [2023-06-08]. （原始げんし内容ないよう存そん档 (PDF)于2023-12-21）.
^ ^4.0 ^4.1 Kotek, Hadas; Dockum, Rikker; Sun, David. Gender bias and stereotypes in Large Language Models. Proceedings of The ACM Collective Intelligence Conference. CI '23 (New York, NY, USA: Association for Computing Machinery). 2023-11-05. ISBN 979-8-4007-0113-9. doi:10.1145/3582269.3615599.
^ Davidson, Thomas; Bhattacharya, Debasmita; Weber, Ingmar. Roberts, Sarah T.; Tetreault, Joel; Prabhakaran, Vinodkumar; Waseem, Zeerak , 编. Racial Bias in Hate Speech and Abusive Language Detection Datasets. Proceedings of the Third Workshop on Abusive Language Online (Florence, Italy: Association for Computational Linguistics). 2019-08. doi:10.18653/v1/W19-3504.
^ ^6.0 ^6.1 ^6.2 Queenie Luo; Michael J. Puett; Michael D. Smith. A Perspectival Mirror of the Elephant: Investigating Language Bias on Google, ChatGPT, Wikipedia, and YouTube. arXiv. （原始げんし内容ないよう存そん档于2024-04-16）.
^ Yucong Duan; Fuliang Tang; Zhendong Guo; Yingtian Mei; Yuxing Wang; Kunguang Wu; Zeyu Yang; Shuaishuai Huang; Shiming Gong. Global Large Language Model EQ and IQ Bias Evaluation -Released by DIKWP -AC Research Group. ResearchGate. 2023. doi:10.13140/RG.2.2.12894.61762 –通どおり过ResearchGate （英えい语）.
^ Zhou, Karen; Tan, Chenhao. Bouamor, Houda; Pino, Juan; Bali, Kalika , 编. Entity-Based Evaluation of Political Bias in Automatic Summarization. Findings of the Association for Computational Linguistics: EMNLP 2023 (Singapore: Association for Computational Linguistics). 2023-12 [2023-12-26]. doi:10.18653/v1/2023.findings-emnlp.696. （原始げんし内容ないよう存そん档于2024-04-24）.
^ Yucong Duan; Fuliang Tang; Kunguang Wu; Zhendong Guo; Shuaishuai Huang; Yingtian Mei; Yuxing Wang; Zeyu Yang; Shiming Gong. "Ranking of Large Language Model (LLM) Cultural Bias" --DIKWP Research Group International Standard Evaluation. ResearchGate. 2024. doi:10.13140/RG.2.2.26652.67200 –通どおり过ResearchGate.
^ Yucong Duan; Fuliang Tang; Kunguang Wu; Zhendong Guo; Shuaishuai Huang; Yingtian Mei; Yuxing Wang; Zeyu Yang; Shiming Gong. "Ranking of Large Language Model (LLM) Regional Bias" --DIKWP Research Group International Standard Evaluation. ResearchGate. 2024. doi:10.13140/RG.2.2.10019.63529 –通どおり过ResearchGate.
^ Yucong Duan; Fuliang Tang; Kunguang Wu; Zhendong Guo; Shuaishuai Huang; Yingtian Mei; Yuxing Wang; Zeyu Yang; Shiming Gong. "The Large Language Model (LLM) Bias Evaluation (Age Bias)" --DIKWP Research Group International Standard Evaluation. ResearchGate. 2024. doi:10.13140/RG.2.2.26397.12006 –通どおり过ResearchGate.
^ Yucong Duan; Fuliang Tang; Kunguang Wu; Zhendong Guo; Shuaishuai Huang; Yingtian Mei; Yuxing Wang; Zeyu Yang; Shiming Gong. "The Large Language Model (LLM) Bias Evaluation (Occupational Bias)" --DIKWP Research Group International Standard Evaluation. ResearchGate. 2024. doi:10.13140/RG.2.2.23041.67689 –通どおり过ResearchGate.

[1] Goled, Shraddha. Self-Supervised Learning Vs Semi-Supervised Learning: How They Differ. Analytics India Magazine. May 7, 2021 [2023-06-08]. （原始げんし内容ないよう存そん档于2023-06-18）.

[Manning-2022-2] 2.0 ^2.1 ^2.2 Manning, Christopher D. Human Language Understanding & Reasoning. Daedalus. 2022, 151 (2): 127–138 [2023-06-08]. S2CID 248377870. doi:10.1162/daed_a_01905. （原始げんし内容ないよう存そん档于2023-03-09）.

[extracting-3] Carlini, Nicholas; Tramer, Florian; Wallace, Eric; Jagielski, Matthew; Herbert-Voss, Ariel; Lee, Katherine; Roberts, Adam; Brown, Tom B; Song, Dawn; Erlingsson, Ulfar. Extracting Training Data from Large Language Models (PDF). USENIX Security Symposium 6. 2021 [2023-06-08]. （原始げんし内容ないよう存そん档 (PDF)于2023-12-21）.

[:1-4] 4.0 ^4.1 Kotek, Hadas; Dockum, Rikker; Sun, David. Gender bias and stereotypes in Large Language Models. Proceedings of The ACM Collective Intelligence Conference. CI '23 (New York, NY, USA: Association for Computing Machinery). 2023-11-05. ISBN 979-8-4007-0113-9. doi:10.1145/3582269.3615599.

[5] Davidson, Thomas; Bhattacharya, Debasmita; Weber, Ingmar. Roberts, Sarah T.; Tetreault, Joel; Prabhakaran, Vinodkumar; Waseem, Zeerak , 编. Racial Bias in Hate Speech and Abusive Language Detection Datasets. Proceedings of the Third Workshop on Abusive Language Online (Florence, Italy: Association for Computational Linguistics). 2019-08. doi:10.18653/v1/W19-3504.

[:0-6] 6.0 ^6.1 ^6.2 Queenie Luo; Michael J. Puett; Michael D. Smith. A Perspectival Mirror of the Elephant: Investigating Language Bias on Google, ChatGPT, Wikipedia, and YouTube. arXiv. （原始げんし内容ないよう存そん档于2024-04-16）.

[7] Yucong Duan; Fuliang Tang; Zhendong Guo; Yingtian Mei; Yuxing Wang; Kunguang Wu; Zeyu Yang; Shuaishuai Huang; Shiming Gong. Global Large Language Model EQ and IQ Bias Evaluation -Released by DIKWP -AC Research Group. ResearchGate. 2023. doi:10.13140/RG.2.2.12894.61762 –通どおり过ResearchGate （英えい语）.

[8] Zhou, Karen; Tan, Chenhao. Bouamor, Houda; Pino, Juan; Bali, Kalika , 编. Entity-Based Evaluation of Political Bias in Automatic Summarization. Findings of the Association for Computational Linguistics: EMNLP 2023 (Singapore: Association for Computational Linguistics). 2023-12 [2023-12-26]. doi:10.18653/v1/2023.findings-emnlp.696. （原始げんし内容ないよう存そん档于2024-04-24）.

[9] Yucong Duan; Fuliang Tang; Kunguang Wu; Zhendong Guo; Shuaishuai Huang; Yingtian Mei; Yuxing Wang; Zeyu Yang; Shiming Gong. "Ranking of Large Language Model (LLM) Cultural Bias" --DIKWP Research Group International Standard Evaluation. ResearchGate. 2024. doi:10.13140/RG.2.2.26652.67200 –通どおり过ResearchGate.

[10] Yucong Duan; Fuliang Tang; Kunguang Wu; Zhendong Guo; Shuaishuai Huang; Yingtian Mei; Yuxing Wang; Zeyu Yang; Shiming Gong. "Ranking of Large Language Model (LLM) Regional Bias" --DIKWP Research Group International Standard Evaluation. ResearchGate. 2024. doi:10.13140/RG.2.2.10019.63529 –通どおり过ResearchGate.

[11] Yucong Duan; Fuliang Tang; Kunguang Wu; Zhendong Guo; Shuaishuai Huang; Yingtian Mei; Yuxing Wang; Zeyu Yang; Shiming Gong. "The Large Language Model (LLM) Bias Evaluation (Age Bias)" --DIKWP Research Group International Standard Evaluation. ResearchGate. 2024. doi:10.13140/RG.2.2.26397.12006 –通どおり过ResearchGate.

[12] Yucong Duan; Fuliang Tang; Kunguang Wu; Zhendong Guo; Shuaishuai Huang; Yingtian Mei; Yuxing Wang; Zeyu Yang; Shiming Gong. "The Large Language Model (LLM) Bias Evaluation (Occupational Bias)" --DIKWP Research Group International Standard Evaluation. ResearchGate. 2024. doi:10.13140/RG.2.2.23041.67689 –通どおり过ResearchGate.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]