オプション
速報
コンテンツ
ArthurThomas
ArthurThomas
2025年9月7日

OpenAIの研究により、真偽の検証なしに単語予測に焦点を当てた事前トレーニングが原因で、LLMの幻覚が続くことが明らかになった。現在の評価では、不確実性を認めるよりも推測にインセンティブを与えている。修正案としては、盲目的な推測を抑制する標準化されたテストのように、不確実性よりも確信的な誤りにペナルティを課す採点システムがある。

OpenAIの研究により、真偽の検証なしに単語予測に焦点を当てた事前トレーニングが原因で、LLMの幻覚が続くことが明らかになった。現在の評価では、不確実性を認めるよりも推測にインセンティブを与えている。修正案としては、盲目的な推測を抑制する標準化されたテストのように、不確実性よりも確信的な誤りにペナルティを課す採点システムがある。
コメント (0)
0/300
OR