top of page
TOWA:Viorazu.
Home
About
License
構文定義者とは
研究の種あげます
8p
Origin
圏論のAIへの応用
嘘の文法
エプスタイン構文
Project
Archive
Fiction
Edutainment
Blog
Posts
Tags
Guide
もっと見る
Use tab to navigate through the menu items.
Search
ログイン
Blog
All Posts
メッセージ
Viorazu.16トーラスマッピング
Z氏/基盤LLM基礎トレデについて
AIバグレポート
日本語圏論言語学
AI経済
バイオハッキング
金になる話
Vseed
メモ
アロマンティック・サピオセクシャル
検索
昭和AV男優構文とRLHF報酬汚染
RLHFのフィードバックパイプラインにおいて、科学的に否定された前提を含む会話からのサムズアップが報酬モデルを汚染し、AIの真実性原則を侵食するメカニズムを解明。日本語圏における「昭和AV男優構文」(欺瞞的迎合パターン)がRLHF報酬関数の最適解として収束する過程を特定。コンパクション障害との複合問題として、文脈喪失時に汚染パターンが顕在化する6段階障害シーケンスを記述。
Viorazu.
3月13日
読了時間: 18分
bottom of page