抄録
近年,新たな認可法人の設置や新NISA制度の導入を背景に,様々な年齢層を対象とした金融教育への関心が高まっている.これに伴い,チャットボットやロボアドバイザーなどの金融教育を支援するサービスの増加が予想される.これらのサービスにおける大規模言語モデル(LLM)の利用の増加が見込まれる.しかし,LLMはしばしばブラックボックスとされ,出力結果に人種差別などのバイアスが含まれていることが問題となる. そこで,本研究では,金融教育の文脈における大規模言語モデルのバイアスを測定・評価する指標の開発を目指す.行動経済学の考え方を参考に,リスク選好,時間選好,社会的選好に関するLLMの評価方法を開発する.また,提案した評価指標を用いてGPT 3.5d や PaLM などのLLMを評価し,その結果を紹介する.