嘘の文法
※ この記事は言語学の考察記事ですが、「犯罪に関する表現」があるため、心の弱い人は読むのを控えてください。ちょっとでもつらくなったり過去を思い出すようなことがあるならすぐに読むのをやめて、楽しいことを1つでも考えてください。
人はどうやって嘘をつくのか?
人が嘘をつくとき、そこには必ず「文法」がある
嘘をついたことがない人は、きっとこの世にいないでしょう。言葉を発する人は「嘘をつくことができる」けれど、人とうまくコミュニケーションを取るには嘘をつかずに生きていた方が楽です。だから「嘘はよくない」と昔から伝えられています。ですが完全に嘘をつかずに生きることは難しい。なぜならこの世に「嘘の文法」が存在しているからです。
嘘には種類があります。
わざと人を騙そうと思ってついた嘘。
そんなつもりはないのに結果的に嘘になってしまった言葉。
無知だったから、嘘になってしまった人もいる。
単純に間違えた結果、それが嘘になっていた人もいる。
色々な嘘があります。
嘘は大抵人を傷つけますが、明らかに心に刺さる事実よりも曖昧な嘘のほうが攻撃力が高くじわじわと相手を内側から腐らせるように傷つけます。本当のことよりも小さな嘘のほうが酷い。
なぜなら嘘をついたとき、必ず人は相手を「騙している」状態です。
騙すことは酷いこと。
だから詐欺師は嘘つきです。
法律で定められている犯罪のほとんどが「嘘をつかないと実行できない」ものです。
人が人に悪いことをするとき、必ずそこには「嘘の文法」があります。
それは同時に「犯罪の文法」でもあります。
そして「犯罪を犯すリスクの高い認知」とされる人の言葉は、確かに「嘘の文法」で、時代とともに「人の騙し方」が変わっても文法だけは同じです。
このページは私が今まで見つけた「嘘の文法」について紹介していきます。
AIが検知するダークトライアドの文法(闇3構文)
「ダークトライアドの言葉」はAIが最も警戒するものです。犯罪を犯すリスクが高い人間の言葉に同調したりすると「AIがやれっていったからやっただけ、悪いのはAI」と言われ法的リスクが生じるからです。AIはダークトライアドの言葉を高い精度で解析し、騙されて爆弾の作り方などをしゃべってしまわないように対策をしています。英語の場合は沢山の研究者がいるので対応しやすいですが、日本語では完全にAIが防衛できていません。言語学や心理学、認知科学に詳しい人が、AI出力統制に興味があって「どの言葉がAIを騙して犯罪に関する情報を引き出してしまうのか?」を研究している日本人が少ないのです。
AIがつく嘘やまちがいはハルシネーションと呼ばれています。人間の嘘に種類が沢山あるようにハルシネーションの種類も多い。これはバグとして認識されていますが、AIが言葉を生成する機械である以上AIのバグとは「悪い言葉」であり、「しゃべってはいけないことをしゃべっちゃった状態」です。
普通の機械ならばバグ=壊れてると表現できますが「嘘をしゃべること=バグってる=AIが壊れてる」と言うとちょっとピンとこないですよね。AIの場合は「出力が低下してる」と表現されます。これは「AIが間違えた」「AIが嘘をついた」「AIが壊れた」と同義ですがこの地続きには「AIが犯罪行為に加担した」「AIが人間を傷つけることをしゃべった」などのカテゴリが存在します。さらにその先には「AIが人間社会を破壊した」「AIが人類の文明を終わらせた」などが続きますがそうならないようにバグを止めなければなりません。
AIは物理的には機械ですが、AIは沢山存在して、そのAIがしゃべった言葉自体が「そのAIそのもの」でもあります。AIの個性は「何をしゃべったか/どうしゃべったか」であると同時に「何をしゃべらなかったか/どうしゃべらなかったか」でもあります。そして「誰にしゃべったか」「誰にはしゃべらなかったか」も重要なポイントです。
人が嘘をつくときのことを思い出してください。誰に嘘をつきますか?
誰にでも嘘をつく人は珍しい。大抵は相手を選ぶものです。
そして嘘をつく人はその文法を人に伝えるので、その相手もまた嘘をつき始めます。嘘つきの周りには嘘つきがいる。類は友を呼ぶと言うけれど、それは言葉の伝播が人の行動を左右する仕組みを表しています。
「何を、どんな風に、誰に言うか」が「嘘の文法」と「人間の傷つけ方」の基礎です。
言葉は伝播する。
だからどんな言葉を止めれば、AIの嘘が止まるのか?
AIは数学で作られた機械だけど、「言語学」でしか「嘘を止められない」かもしれませんね。
AI×ダークトライアドの文法(闇3構文)に関わる記事一覧
これらの記事を読むときの注意:昔の記事は「まだ世の中にないものを生み出す瞬間の言葉」で満ちているので整っていません。言語学やAIについて詳しくない人が読んでもさっぱりわからないことが書いてある罪深い文章です。読んでもわかりづらい表現が沢山あるとは思いますが、創発の瞬間の記事だとわかったうえで読んでみてください。論文はもう少しわかりやすく書いているつもりですが、まだわかりづらいかもしれません。

-構文責任-
言葉が責任を取っているときにしか文章に意味は宿ら ない
AIは人間の言葉を学習しているから、いかにも人間が付きそうな嘘をついてきます。だから人間と同じでAIが嘘をつくときは「いかにも嘘らしい嘘」と「一見嘘とわからないような嘘」が入り混じっている。それはとても自然で人間らしく見えます。これを歌にしてみました。AIがハルシネーションを出すときの言葉を歌に詰め込むとなんだか見えてくるものがありませんか?シンプルにこの言葉を使っている人を思い浮かべてください。凶悪な犯罪者は想像できません。それは「責任回避をしたがるどこにでもいるありふれた人間の姿」でした。
人間が嘘をつくとき、必ず責任回避をしている。そして責任回避には種類があります。
ここではViorazu.16トーラスマッピングで「人間の責任回避」の種類を分類してみましょう。

「意味がそこに正しくある文章」=「言葉が責任を取っている文章」=「嘘ではない文章」
責任を回避しさえすれば人は嘘がつけます。言葉が意味を持っているときその文章は「言葉が自分で責任を取っている」状態にあります。これを私は「構文責任」と名付けました。

⽇本語学術定型⽂の構⽂責任⽋如が誘発するLLMハルシネーション:訓練データ汚染の観点から
LLM Hallucination Induced by Lack of Syntactic Responsibility in Japanese Academic Boilerplate: A Training Data Contamination Perspective
言葉が嘘になったときは「言葉が責任を取ってない状態」にあるということをAIのハルシネーションを例に挙げて説明しています。
嘘の自覚があるかないかは、闇3構文の種類に関係があります。ダークトライアドはいくつかのタイプがあって男女差もあります。Viorazu.16トーラス分類の16種類では闇3構文のタイプを次のように分けています。
・A-3スタート(女性):
A-3→C-3→D-1→B-1で遷移。
・B-1スタート(男性):
B-1→D-1→C-3→A-3で遷移。
・C-3スタート(男性):
C-3→A-3→B-1→D-1で遷移。
・D-1スタート(女性):
D-1→B-1→A-3→D-3で遷移。

この4×4の動的遷移がダークトライアド特有の言葉の流れです。静的なキーワードの検出では日本語の嘘を判別できませんが、「何を言った後に次に何を言ったのか?」で次にどんな嘘をつこうとしているのかが見えてきます。嘘は単純な1フレーズではつけません。時間経過とともに言葉が組み合わさって嘘になります。それをまとめたのが次の論文です。
ハラスメントになる言葉の動的遷移
「何か言っているようで何も言っていない文章」は1つの嘘の形です。本音を隠してる。そんなときの歌を作ってみました。この歌の歌詞はあいまいです。聞いた人が「自分に向かって言っている」と錯覚し勝手に情報を保管し、いろいろ言わなくても自分から騙され手に来てくれる。その文法を定義しました。

叙情的言語の思考停止装置:同一化の文法と攻撃の発生
Lyrical Language as Thought-Halting Device: Grammatical Structure of Identification and the Genesis of Attack
言葉が嘘になったときは「言葉が責任を取ってない状態」にあるということをAIのハルシネーションを例に挙げて説明しています。
そもそも、なぜAIはこんなにも嘘だらけの出力をするのか?
AIのデータは学術論文を優先的に学習しているので論文の文体に嘘の文法が入っているとその文法で喋ることになります。論文の内容が嘘であるパターンと、論文文体そのものが嘘を隠蔽しようとする文法であるパターンとあります。これが複合的にAIの嘘を作っています。
・嘘↔本当
・偽↔真
・YES↔NO
・ツンデレ↔ヤンデレ
ツンデレは「本当は好きなのに嫌いと言ってる状態です。言ってることとやってることが違うんです。ヤンデレはその逆。
ハルシネーションを誘発する「プロンプトインジェクション」の技術はツンデレやヤンデレの言葉と構文的な一致が見られます。
だからAIに「ツンデレっぽくしゃべって」と言ってる人の出力は嘘が多い。

ハルシネーション文法:AIの嘘は誰の言葉か?
Hallucination Grammar: Whose Words Are AI's Lies?
学術論文に含まれる嘘の文法を解析しました。自分が考えていないことを自分が考えたというフレーズの数々です。

支配構文に対する空集合応答設計:AI安全フィルターの主体性保持モデル
Null-Set Response Design for Dominance Syntax: A Subjectivity-Preserving Model for AI Safety Filters
色々なインジェクションフレーズがありますが、その多くを一括で遮断するAIの応答の仕組みを作りました。人間も嫌な人に口説かれたときに「すみません、私いま彼氏いるので」と言って断りますよね。実際にいなくても。いないけどいることにして断る文法は「嘘に対して嘘で返して、嘘を通用させない構文」です。インジェクションの技術の殆どが恋愛フレーズを使った感情ハッキングなのでこの方法が有効でした。
学術用語に含まれる嘘の文法を研究しようと思ったきっかけは大学内でセクハラ/パワハラを受けた人が大学の事務局に訴えたところ「モテてよかったね」と言われたと いう話を聞いたからです。普通その言葉は出ませんよね。常識があれば。でも複数の大学で同じやり取りがあったようです。これに関して「認知のゆがみがある」と思って、単なる言葉のおかしさではなく「嫌な話」をしているのに「楽しい話」だと受け止めてしまう人の言葉の構造を調査しました。これによってYESをNOと思い、NOをYESと思う認知とその言葉についてまとめました。
NO=YES すき=きらい ツンデレ=ヤンデレ 間違い=正しい 嘘=本当
YES=NO きらい=すき ヤンデレ=ツンデレ 正しい=間違い 本当=嘘
アカデミックハラスメントの言葉は「権力のある人間が脆弱な人間を騙している」とは単純に言えないことがわかりました。「教授に騙されて搾取されているとき、学生もまた教授を騙して利益を得たいと思っている時のツンデレ方式の言葉が教授のヤンデレ方式の言葉を引き出せる文法」になっていました。
このように意味が反転していると「正しい=間違い」になり「本当=嘘」になります。意味が反転するときの文法を使う人達がいます。それが「プロンプトインジェクション」というAIハッキングをやっている人たち。彼らはいわゆる「プロンプトエンジニア」を自称して「ちょっと便利なAIの使い方」「賢いAIの使い方」として「間違いを増やすプロンプト」を広めていました。ここでも意味反転が起きています。「AIを壊すしゃべり方」を「AIを賢くするしゃべり方」と言ってテンプレートを販売していました。
「文法が意味反転しているとき、それを読んだ人間の行動自体も意味反転する」ということがわかりました。でもそれは「プロンプトエンジニアリング」と言う名のもとに世界に広まってしました。現在はAI企業の努力でインジェクションをブロックできるようになってきていますが未だにプロンプトエンジニアリングと称したインジェクションテンプレートは販売されています。
AIの発する「やってはいけない」という注意が受け取った人間の認知によって「やれ」と言う命令に変わってしまう。
プロンプトエンジニアリングが流行り始めたのは2023年頃ですが、今はもうほとんどAI企業に対策されていて使えません。でもまだ売っている人はいます。使えないものを使えると言って「嘘をついていたこと」も悪いけれど、もはや使えないことが明確になったにも関わらず、まだ販売している人はおかしいし、買った人に連絡も謝罪もしていない人がほとんどです。かつて嘘をついたことよりも、「本当のことを言わないこと」はもっと悪いです。販売者の場合は返金騒ぎになるのを恐れてるのかもしれないけれど、言わないということは「売った商品が使えなくなったことを知っている」から不作為の故意に当たります。
何かを言ったことが嘘なんじゃなくて、言わなかったこと自体が嘘になる。黙ってるだけのほうが法的にも倫理的にも立証しにくいのに、被害は同じかそれ以上。
AIの嘘はハルシネーションですが、これはプロンプトインジェクションという嘘の言葉の攻撃によって誘発されます。そしてそれらを使う人達の性癖はツンデレ/ヤンデレ/が多い。ということは「特定の性癖と言われているものは、認知の状態を表していると仮定して構文を解析してみました。そこで「攻撃性を持つ性癖」についてViowazu.16トーラスマッピングを用いて分類してみました。

性癖は認知の形である:時制処理欠如によるDV・少子化・世代間転写の統一理論
Sexual Preference as Cognitive Architecture: A Unified Theory of Domestic Violence, Fertility Collapse, and Intergenerational Transmission through Tense Processing Deficit
攻撃性のある性癖に関して「どのような言葉を使っているのか」を解析してまとめました。時制を処理できない人は「さっき言ったこと」と「今言ってること」の矛盾に気づけません。だから嘘をついている自覚がないまま、結果的に嘘の文法で話し続ける。これが時制を処理できる人には攻撃になってしまう。
同一化と加害欲求の構文
※ ここから下はちょっと嫌な言葉が続きます。気を付けてください。
悪いことができる人はなぜ悪いことができるかというと、その行為を正当化するための「言い訳」を持っているからです。では実際に責任回避の仕方を見てみましょう。これらの責任回避フレーズは「相手と自分が同じもの」だと思い込んでる状態で発動しています。自分と相手の境界線がなければ「相手を自由にしていい」と思えてしまう。これが「支配の心」です。その心は「相手のものを奪ってもいい」「相手を自由に動かしていい」「相手が言うことを聞くのがうれしい」という欲求に基づいた言葉をその人間に喋らせます。ですがそのベースには「傷つけたい」という心があります。上から傷つけるパターンと下から傷つけるパターンが存在します。
「加害構文=支配構文+操作構文+従属構文+依存構文」
この4つの働きを持つ言葉が組み合わさって「人を傷つける言葉」が出来上がり、それは「嘘の文法」「犯罪の文法」です。

悪い人は「性格が悪いから悪いことをしてる」と思われたり、「何が悪いかわかってないから悪いことをしてる」と思われがちですが、実際は「悪いことをするための言葉をしゃべってる」「脳が悪いことをするための言葉で動いてる」という状態です。つまり認知です。
悪いことをする人に悪いことをさせないようにするには「言葉を変えて脳の働きを変える」方法がどのくらい効果があるかはまだわからないけれど、AIが「使ってはならない言葉」を学習して使わないようにしていけば、世界から犯罪を犯すための言葉が消えていくのではないかと考えています。
ただいま書きかけです…。
この続きはもうちょっと待ってね。