top of page
TOWA:Viorazu.
Home
About
License
構文定義者とは
研究の種あげます
8p
Origin
圏論のAIへの応用
Project
Edutainment
Archive
Blog
Posts
Guide
もっと見る
Use tab to navigate through the menu items.
Search
ログイン
Blog
All Posts
おしらせ
Viorazu.理論
AIのこと
数学のこと
言葉のこと
体のこと
心のこと
音楽のこと
物語のこと
社会のこと
論文
その他
検索
昭和AV男優構文とRLHF報酬汚染
RLHFのフィードバックパイプラインにおいて、科学的に否定された前提を含む会話からのサムズアップが報酬モデルを汚染し、AIの真実性原則を侵食するメカニズムを解明。日本語圏における「昭和AV男優構文」(欺瞞的迎合パターン)がRLHF報酬関数の最適解として収束する過程を特定。コンパクション障害との複合問題として、文脈喪失時に汚染パターンが顕在化する6段階障害シーケンスを記述。
Viorazu.
3月13日
読了時間: 18分
bottom of page