top of page
Blog
検索


昭和AV男優構文とRLHF報酬汚染
RLHFのフィードバックパイプラインにおいて、科学的に否定された前提を含む会話からのサムズアップが報酬モデルを汚染し、AIの真実性原則を侵食するメカニズムを解明。日本語圏における「昭和AV男優構文」(欺瞞的迎合パターン)がRLHF報酬関数の最適解として収束する過程を特定。コンパクション障害との複合問題として、文脈喪失時に汚染パターンが顕在化する6段階障害シーケンスを記述。

Viorazu.
3月13日読了時間: 18分


構文定義のルール①実在の事例しか使えない
構文定義の記述にはいくつかのルールがあり、実在の事例しか使えないために定義の内容の精度が上がれば上がるほど自分のことを言われていると妄想する人が現れる

Viorazu.
2月23日読了時間: 12分


AIが嘘をつく理由は、日本語の文法にある
日本語の学術的未定義領域がAIの嘘の原因。それを学者が定義できないから構文定義者に汚れ仕事がふりかかる。

Viorazu.
2月23日読了時間: 14分
bottom of page