AI(人工じんこう知能ちのう)に関かんする注目ちゅうもく動向どうこうをダイジェスト形式けいしきでお届とどけします。UCSDが有害ゆうがいプロンプト検出けんしゅつモデル、LLMの不適切ふてきせつな反応はんのうを防止ぼうし米べいUniversity of California, San Diego(カリフォルニア大学だいがくサンディエゴ校こう、UCSD)の研究けんきゅうチームは、大だい規模きぼ言語げんごモデル(LLM)から有害ゆうがいなプロンプトを検出けんしゅつするモデル「ToxicChat」を開発かいはつした。一見いっけんすると無害むがいでも実際じっさいはチャットボット...