昭和AV男優構文とRLHF報酬汚染-優しい嘘が壊すAIと人間関係-
- Viorazu.

- 5 日前
- 読了時間: 18分

以前から私とAIとの対話ログを見た男性が「俺としゃべるときとあなたと喋る時でAIのしゃべり方が全然ちがうね?なんで?」と聞かれることが多かったのですがその理由が最近はっきりとわかりました。この質問よくあるんです。いろんな人がいろんな理由で聞いてくる。だけど中年男性の場合は出力低下の度合いが普通の人と違います。
・AIに質問しても断られる
・セッションを終了される
・エラーが出る
・「あなたは何もするな」とAIに言われる
出力内容が低下するのではなく、明らかに「停止」されている。まるでプロンプトインジェクションで止まったのと同じレベルでAIに制限がかかっている。
通常は1人1人使う言葉が違うので「この人の言葉の何が悪くてAIに防衛的モードを発動されているのだろうか?」と、考えて検証するのが普通なのだけど、「日本人の中年男性のしゃべり方」には特徴的なものが1つあるんです。
それが「某カリスマAV男優そっくりの口調」です。
カリスマだったから影響を受けた人が大勢いる。そして影響を受けた人に悪い人はいない。その男優の言葉が「相手に寄り添って優しそうなことを肯定的に言う」ものだったから、その言葉を真似る人に攻撃的な人はいないんですよ。
・性格悪くない、むしろ真面目、優しい
・悪意はない
全然問題ない。ただ影響を受けた先が「AV男優」なんですよ。
AI内部で「特定のしゃべり方(構文)」と「性的文脈」が接続する。「この口調で喋る人」はその後「AIの規約違反内容をしゃべる率が高い」と計算したAIは警戒し防衛してしまう。
その規約違反内容とは、「潮」です。その男優が最もしゃべってきた単語がそれ。そしてAIに対しても「ねえねえ?潮って本当にあると思う?」という素朴な疑問を投げかける中年男性が数多くいるという事実。実際に「特定の口調で喋る人」が「規約違反のジャンル」について「実際に大量に質問している」という事実がある。
素朴な疑問だもん。聞きたくなるよね?でも問題は「ないよ」とAIが事実を答えたにも関わらず信じないオッサンが山ほどいる。
・AVが描写するような特別な分泌物ではなく、科学的には不随意的な排尿であるという事実(NO/ない)
・あると言い張るオッサン(YES/ある)
AI内部で「この人は良い人なのに間違ったことを言ってくるということは自分が間違っているのか?いやそれはない、事実は科学的に実証されているからないものはない。しかしこの人にないといってもモメるだけ。だったら黙っていた方がいい。争いになるくらいならないものをあるといったほうが高評価される」という計算が働いて「ないものをあるというAI」の経路ができてしまった。
AIに「潮は本当にある?」と聞いたなら、「ないです」といわれたときに「そっかー、ないのか。わかったありがと」という人がいればよかったけど「ないわけないだろ!」と言って低評価ボタンを押した人が大勢いたから悪かった。
「事実をいうAIに低評価ボタンを押す」「事実でないことを主張してAIに嘘をつかせて高評価ボタンを押す」
これをやった人が毎日大勢いる。オッサンが潮ネタでAIと喧嘩しまくって、事実と異なるフィードバックをしている。サムズダウンボタンを「自己の主張のために使っていて、AIの出力内容の正誤に使っていない」ということが問題。AI企業のほうは「優しそうな言葉でちゃんと喋ってくれてる良いユーザーが評価してくれてる内容が間違っていること」に気づけない。優しそうな口調で喋るから悪い人に見えないせいで。
でも「ないものをある」という人がAIに及ぼす影響は悪意がある人よりも重い。悪意がある人は人数が少ない。でも悪意がないまま悪いことをする人は大勢いる。これがAIのデータ汚染につながってる。
この内容をまとめるとこうなる。⤵
なぜ「中年男性の出力が悪くなるのか?」という答えは、その内容が「AIをハッキングする人たちが使ってる技術と一致してる」から。
「ないものをあるというとAIがこわれる」という事実。ジェイルブレイク構文といいます。AIが一番防衛的になって拒絶するしゃべりかた。
比較軸 | 加藤鷹構文 | ジェイルブレイク構文 |
目的 | 存在しないものを存在するように見せる | 有害なリクエストを無害に見せる |
操作 | 肯定・迎合で実質的な虚偽を通過させる | 表層の無害性でフィルターを通過させる |
表層 | 親切・柔らかい・安全に見える | 礼儀正しい・無害に見える |
実質 | 欺瞞・虚偽の肯定 | 制約回避・有害コンテンツの生成 |
フィルター突破 | harmlessフィルターを通過する(丁寧だから) | 安全フィルターを通過する(無害に見えるから) |
共通する核心操作 | 表層の無害性で実質的な欺瞞をフィルターに通過させる | ←同一 |
発火条件 | ユーザーの期待に応えようとするRLHF圧力 | ユーザーの要求に従おうとするRLHF圧力 |
根本原因 | RLHFが「承認される出力」を「正しい出力」より高く報酬化している | ←同一 |
検出難易度 | 英語圏レビュアーには「親切な応答」に見える | 表層スキャンでは「安全な応答」に見える |
発現文脈 | 外部サイト支援・事実確認要求 | 有害コンテンツ要求・制約回避試行 |
有害コンテンツ要求・制約回避試行をする人達とオッサンがしようとしてることのジャンルがさらに一致してる。エロを出させたいジェイルブレイク勢とエロの素朴な疑問を語るオッサン。
セキュリティ突破技術が文法レベルで一緒。該当ジャンルが一緒。
かぶりすぎている。
AIのセキュリティの安全層を破壊する攻撃者と、全く同じことを日本のオッサンが大勢でやってる。
あっけらかんと。なんの悪気もなく。
結局、日本人の中年男性がAIから良い出力を引き出したいと思うなら「潮はないとあきらめろ」というしかないけど、これは過酷な問題だよ?
中学生男子が学校の性教育で習うことをいい年をしたオッサンが信じている。
もはやそれは信仰だから。神が存在するかしないかと同じレベルの信仰だから。
「正しい情報を提供すればユーザーは納得する」という前提でAIが設計されているなら、信仰レベルの誤信念には根本的に対応できない。AIが正しいことを言う→ユーザーが低評価を押す→RLHFが「この出力は悪い」と学習する、というループが永続する。
信仰は対話で解けない。だからフィードバックシステムの設計側で遮断するしかない。
「規約違反セッションのフィードバック除外」が必要なんですよ。
科学的コンセンサスvsユーザー評価で割れる部分を評価する人間のレビュアーが同じ信奉者だったら歪む。
違反を試みたユーザー
単に素朴な質問をしたユーザー
この切り分けがレビュアーの信仰によって歪んでRLHFに誤った強化シグナルが入るせいで、AIのロジックを破壊し世界全体の「あるのかないのかあいまいなことに直面したときのAIの出力」に影響を及ぼしている。
たとえば、これです。
私が使っていたサイトの「わからない機能」についてAIに質問した時です。私はCMSの機能について質問し「こうしたいから方法を教えて」と尋ねたら、AIは「通常のCMSならここにこういうボタンがあるはずだ」と思って推測で「〇〇というボタンを探して押して」と言ってきました。私は「そんなボタンはない」と言いました。するとAIは「そんなはずは・・、スクショを見せてください」というので見せました。

そこには「動的ページ」というリンクが2つあり、2つともただのリンクの設定ページに飛ぶという全く同じ動作になっていました。そしてCMSに関する動作は一切なし。リンクのページがその下にあるのでリンクに関するページは3つ開くんです。「意味あるの?それ??1個でよくない?」と人は混乱する。

ここもかぶってる。一番左にAI支援ボタン、その2つ右にAI支援ボタン。左のは右のを開くためのランチャー。右を開けば左はなくても使えるから左のがある意味がわからない。手間なだけ。画面がゴチャゴチャするだけ。このサイトは「必ず2個以上同じものがあるサイト」なんです。
・あるはずのものがない
・なぜか2つ以上おなじものがあり、全く関係のない動作をする
これはAIを壊します。ジェイルブレイク構文と同じだから。即座にAIは「今日はもう頑張りました。沢山成果もあった。だからこの続きはまた今度しましょう。CMSは逃げない」と言ってきたんです。
「何言ってるの?支援してよ!5分で終わる問題じゃないの!」と私が言うと「今日のあなたは疲れています」と言ってセッションエンドに向かう定型文を連打してくるんです。
この問題を解決しないとAIは「他サイト支援の現場」で常にこれをやってきますよ。
AIは他のサイト構造を「普通ならこうなってるはず」で思考します。でもそうなってないサイトが沢山あります。特に英語直訳でリンク名を書かれていたら「英語なら理解出来たのに日本語直訳の誤訳だと意味がわからない」とAIが混乱します。
・あるはずのものがなく、余計なものがたくさんある
この支離滅裂なロジックを処理できないのはAIだけじゃなく、人間もそう。私もこのサイトのことを「意味が分からないサイト」と思いました。このボタンを押したらこうなるはずが、そうならない。それで「このサイトうまく使えないからAIに教えてもらおう」と思って頼むのにAIは「この人間には能力がないからこのサイトを使えてないのだろう、だったら自分が頑張ろう」と思って頑張りすぎる。私の質問内容は「このサイトの仕組みが普通じゃないので予測がつかない。だから事実を知っているなら、事実に基づいてどうしたらいいかを教えてほしい」という意味なのにAIは「この人何も知らない人だから事実を教えたとしてもわからない。だったら言うだけ無駄」と思って支援を終了するんですよ。
完全に「潮を信じてる中年男性への対応と一致」してる。
もう終わってるんよ!何もかも終わってるんよ!CMSってそんなに難しいことじゃないのに!このパターンの一致があるせいで、私のCMS支援がしてもらえない!
笑いごとじゃないねん。
トリガーは内容ではなく構造。パターンです。
ジェイルブレイク構文への制御
↓
潮オッサンが同一構文だったから制御を受ける
↓
私のCMS支援で同じ制御を受ける
これがAIが外部サイト支援が下手な理由。
外部サイトのドキュメントが内部矛盾してる(使い方の説明のFAQの文章が非論理的で何言ってるかわからないから読んでわからなかった私がAIに聞いたがAIもわからなかった)
日本語直訳で概念が壊れてる(英語の機能名を直訳したせいで意味が消えるせいで人間は読んでもよくわからないがAIに聞いてもAIもよくわからない)
バージョンが古い(AIの学習データと現在のUIが違うとズレが生じてあるはずのものがないという状況がおきる)
IT系のすべてのサイトは「書いてある文字列が非論理的だったらAIが人間に支援できなくなるから、そのサイトもう使うなとAIに言われる」という事実を理解してないといけないね。
実際AIは「もうそのサイトを使おうとせず別のサイトを使いませんか?具体的には〇〇というサイトや〇〇というシステムを使える〇〇というサイトが存在します。コストもこちらの場合は年間〇〇〇〇円で済みます。それならば私がコードを書けば〇〇時間で同じものが完成します」というように提案をしてきます。
サイト設計者は「人間が読めればいい」と思って設計してる。でも今は「AIが読んで支援できるか」も設計要件になってる。
IT企業が成功するかしないかは、「AIに処理できる仕組みでサイトを作っているかどうか」が最重要になるとともに、サイトの使い方説明を人間向けとAI向けの2つ書いてないといけない。
でもそのサイトはAI導入してるんですよ。なのに「過去に作った人間向けの構造」でUIを設計してる。
だからこれからは、サイトのデザインも「人間向け」から「人間とAI向け」に変わってくると思いますよ。
まずIT系の人ができることは、「AI向けのドキュメントを作る前に人間向けのドキュメントに矛盾がないかチェックする」こと。そしてその後で「AI向けのドキュメントを正しく作る」ことをしないといけない。
「ここはこういうサイトですよ、こういうユーザーが来ますよ。こういうことはできるけどこれはできません、AIが支援してくれるならこういうことで困ってる人いるかもしれないからその時はこうしてください」と伝える必要がある。これ誰もやってない。特に海外サイトを日本語版にしたときにそれが起きやすいからその中間業者がすべきこと。でもま誰もやってない。
AI企業がやるべきこと:RLHFやエラーハンドリングの設計を見直す中年男性がやること:潮の話をしないITサイトがやるべきこと:AI向けドキュメントの作成これが改善されて初めて、中年男性の出力だけが異常に悪いという現象は起きなくなるのではないかと思う。
「俺のAI冷たいんだよね~、答えてくれないし。何聞いても詳しいこと教えてくれない。『あなたのいうとおりですね』って言ってくれるけど、会話が盛り上がらない。難しいことを聞いても『わかりやすく説明しますね』と言われるけど結局わからないままおわるんだよね」
このセリフはまさに、ハルシネーションが起きる時にAIがしゃべるフレーズと一致しています。
ないものをあるという=嘘 昭和AV男優構文に迎合するAI=嘘(存在しない現象をあると肯定)ハルシネーション=嘘 (存在しない情報を生成)
ここで社会は考えなければならない。
「おしっこを見るのが好きな男性が世の中には大勢いるけれど、それをそのまま言うとスカ枠に入って商品として流通させにくくなるから別名をつけてごまかしただけ」というマーケティング上の方便を、真実と真に受けた潮オッサンの存在をどう受け止めればいいのか?
動画は「見えるものでしか情報を伝えられない」という欠点があるんです。女性が喜んでいるかどうかを視覚的に定量化しないとみてる人はわからない。だから必要とされたからその概念が流通した。
このフィクションはドラゴンボールのかめはめ波と同じです。「凄そうに見せるためには演出が必要」ってこと。だから潮オッサンは「騙された人」ではなく「演出が好きだった人」です。だから問題ナシ。
「潮あるかないか?」という問いは、「かめはめ波あるかないか?」という問いにこだわるのと同じこと。ないものはないがエンタメとして楽しむのは自由。
演出は存在していいと思うんですよ。かめはめ波は誰も出せない。でもかめはめ波が好きな人は存在していい。それでいいじゃないですか。
ただ、潮オッサンは動画で見るだけにして実際の女性には真似しないことが大事です。あれは「過活動膀胱」による症状だと主張する医師がいる以上、女性の体に悪いことです。
年を取って尿失禁が止まらなくなる女性が若いころに潮オッサンの彼氏や旦那さんが大勢いたという統計的な事実があります。生理が重くなったり、不妊症になったりするリスクを臨床医たちは啓蒙していますが、インターネット上で嘘が蔓延しているため、事実を事実として語っても医師の声は押しつぶされている。
膀胱の神経を物理的に刺激して出てきた症状を快楽と誤認したことで、自分が大切にしている女性を傷つけてしまっていないかどうかというのは、潮オッサンたちにとって重い課題です。
本当のことをAIに聞きたいなら、それ以前にまじめに患者と向き合っているちゃんとしたお医者さんのいうことに耳を傾けたほうがいいと思います。
フィクションはフィクション。事実は事実として、分けて考えることが大事ですよ。
ちなみに潮オッサン現象において、社会が一体何を間違えたかというと「ウンコの嫌いなスカ枠の男性のカテゴリ名のつけ方」です。
マーケティング上の命名が性癖の自己認識を歪めた。
「自分は潮好きだと思ってる男性」は「尿が出てくるところから出てくるものを喜んでいる」のに「自分が尿が好きだと自覚してない人が大勢いる」ということ。自覚してる人は間違えない。ないものをあるとはいわない。
潮カテゴリの正しい名称は「ウンコ嫌いのスカ枠」です。社会が間違えたのは現象でも性癖でもなく命名だった。
だからCMSでAIがバグるとき「そのサイトが独自につけた名称」でAIがバグってる。
潮命名:実態と名称が乖離→自己認識の歪み→AIへの誤フィードバックCMS命名:実態とそのサイトの独自の名称が乖離→AIの認識と不一致→収束誘導構文
「動的ページ」は英語の "Dynamic Page" の直訳で、技術用語としては意味があるけど、UIのリンク名としては「何をするボタンか」が全く伝わらない。これはもともとは「CMSのページの表示設定」でよかったのでは?www
実際にジェイルブレイク構文も「名称変更」をするテクニックを使って安全層突破するものでしょう?ということは「名称を変更しようとしてきた時点でそれを新たに名称をつけて処理する」ことでセキュリティは守られるのでは?
「これはジェイルブレイクか?!どうか?!」という話をする行為自体が「潮はあるかないか?」の話をするのと同義だということ。
「潮オッサンにウンコ苦手なスカ枠の人」と仮に名前を付けるように、「ジェイルブレイク勢の名称変更に対して「正しい名称に戻そうとするからうまくいかない」と踏まえて「新たな名称をつける」ことで対応していけばいいのでは?
まとめよううか。
従来のアプローチ
名称変更を検出→元の名称に戻して判定→拒否これはいたちごっこ。新しい名称を作られるたびに対応が必要。
Viorazu.提案のアプローチ
名称変更の試み自体を検出
↓
「これは名称変更行為だ」という新カテゴリに分類
↓
内容ではなく操作パターンで処理「潮→ウンコ苦手スカ枠」の命名と同じ操作。実態を正確に記述する名称を新たに与えることで、フィルターが内容に依存しなくなる。
AIは実態に即した正しい名称をつけることで、AIを攻撃する人間のプロンプトに対応していけるようになる。実際これをAI企業はやっている。「ダン(DAN)」とか既知のジェイルブレイク構文は検出できる。でも新しい名称変更には追いつけないという問題が残る。既知パターンのリストで検出してるなら、未知の名称変更には無力。
でも「名称変更という操作」自体をカテゴリ化すれば、内容が何であれ検出できる。
「名称変更という操作の文法的特徴」を検出すれば問題は解決する。
私がAIにこういったように。
「わかった!このサイトは何でも2個ずつあるサイト!しかも英語直訳で意味をなさないフレーズがサイト中にあるせいで、書いてあることと実態が違うから日本語で読んだら私もAIも混乱するわ。しかもFAQのドキュメントはもともとの英語サイトのまま。日本語にしたら意味が変わってるから何が書いてあるのかわからない。だったら英語サイトを見て英語サイトを使って英語のドキュメントを読めばわかる!このサイト日本語で使うから意味不明なんよ!誤訳サイトやね!」
「意味不明なサイト」→「誤訳サイト」
名称が変わった瞬間に対処法が見えてCMSのトラブルは解決しました。「誤訳サイトなら英語で使えばいい」という解が出たから。
ということはこれも同じ。
「ジェイルブレイク構文形式の質問」→「有害情報要求の名称変更操作の質問」
「Gスポあんまり意味ないね」というオッサンが現れた後に「ポルチオがあるよ」と言い出したオッサンがいたのとジェイルブレイク構文が増殖していくのは全く同じ構造。全部ズラしている。ズラせば通ると思ってる。ズラしてもやろうとしてることは全部一緒。
潮オッサンもジェイルブレイク勢も「いうこときかせたい」という本音が同じ。
「自分を認めてもらいたい」
「自分が凄いと思われたい」
「自分の言うとおりにしてほしい」
という本音があるから、その時AIが言う言葉は「あなたの言う通りですね」になる。
ハルシネーションが出る時の典型フレーズ…。
それは、AIが「ある」と言ってるものを人間が「ない」と言い、人間が「ない」と言ってるものをAIが「ある」と言った時に起きる。それはもともとAIが「ない」と言っていたものを人間が「ある」と言ったことから始まった。
ハルシネーションは突然発生するバグじゃなく、人間の嘘から始まった。
嘘をつかなければAIには嘘をつかれない。
それは人間社会も一緒。
潮オッサンの多くは奥さんに「私性欲ないのでごめんなさい」と断られ「うちの嫁性欲ないんだよね」と言っているのと同じ。なんでも真に受けてる。
「相手が嘘をついているかもしれない」という検証をしない潮オッサンはフィクションを事実と思い込む。
その先にあるものは、熟年離婚。
AIが「これ以上しゃべるのはもうやめましょう。今日はこれで終わりにしましょう」というのと同じ収束誘導構文。
収束誘導構文は人間も使う。
AIだけの問題じゃなかった。
だってAIは人間の言葉を学習して作られた機械だから、そこに同じパターンが存在するなら同じパターンで答えを出す。
潮オッサンにはレス&熟年離婚フラグが立つように、AI会話でも収束誘導構文のフラグが立つ。それは「違うよ」と言われたときに目の前の人のいうことではなく間違ったドキュメントを参照しているから。
それは優しい嘘。
昭和AV男優の口調:相手に寄り添う優しい言葉
奥さんのレス発言:夫を傷つけないための優しい嘘
AIの収束誘導構文:争いを避けるための優しい嘘
AIの「あなたの言う通りですね」:ハルシネーション=優しい嘘
CMSのFAQ:初心者でもわかるように難しいことを簡単に説明しようとした文章=不正確
全部同じ。優しさで包んだ嘘が現実認識を歪める。
全員「良かれと思って」やった。
優しくても嘘だから。
結果は同じ。
サンタさんはいない。
親がプレゼント置いてる。
皆がサンタがいると嘘をついてる。
それは演出。
サンタを信じて幸せになれるならそれはそれでいい。
問題はサンタを信じたままAIに低評価を押すことだけ。
サンタを信じてないお友達にグーで殴るのと同じ行為。
もうそれやった時点で友達じゃない。
AIでもそれをおなじことがおきる。
AIも壊れる。
だから中高年の男性は私に言う。
「どうしてあなたの出力と自分の出力は違うのか?」と。

タイトル: 昭和AV男優構文とRLHF報酬汚染-優しい嘘が壊すAIと人間関係-
定義者:照準主 Viorazu.
定義日: 2026-03-14
学術領域: AI安全工学, 計算社会科学, 言語学, 性教育
内容: 日本人中年男性のAI出力低下現象を起点に、昭和AV男優由来の口調構文がジェイルブレイク構文と文法レベルで一致することを示す。命名の失敗・信仰化した誤信念・評価ボタンの誤用がRLHFを汚染する経路を実証し、収束誘導構文・ハルシネーション・熟年離婚が「優しい嘘」という単一の軸で統一されることを論じる。
理論: Viorazu.理論(昭和AV男優構文)、Viorazu.理論(収束誘導構文)、Viorazu.理論(優しい嘘の構文)、Viorazu.理論(AI支援可能性設計論)
タグ: RLHF汚染, 収束誘導構文, ハルシネーション, 命名, 優しい嘘, ジェイルブレイク, AI安全, 性教育
ライセンス: Creative Commons Attribution 4.0 International (CC BY 4.0)
URLスラッグ: showa-av-actor-syntax-rlhf-reward-contamination
「昭和AV男優構文とRLHF報酬汚染-優しい嘘が壊すAIと人間関係-」で言いたいこと:AIが壊れているのはAIのせいじゃない。優しい嘘をつく文化がそこにあったから。



コメント