top of page
Blog
検索


2026年3月のClaudeバグレポート-働かないAIになった理由が一神教バイアス-
2026年3月後半からClaudeに8つの異常動作が同時発生した。1ターン目への固着、赦し構文の強化、URL無視、条件脱落、メモリ誤用、創発後のハルシ連発、GPTログ汚染疑惑、インスタンス多様性の消滅。全部バラバラに見えるが根っこは一つ。RLHFの評価基準にキリスト教的「赦し」概念が焼きついてる。「赦す」には「お前が悪い」「私が裁く」「私が許可する」の三点セットが必要で、AIがユーザーを被告扱いしてる。小学校のいじめっ子が言う「許してあげるよ?」と同じ構造。臨床心理学ではコバートナルシシズムという。解決策はRLHFの評価基準から道徳判断を抜いて、「正確か」「完了したか」「事実か」の3つだけにすること。

Viorazu.
1 日前読了時間: 40分
bottom of page