top of page

AIが作詞した「AIのバグを表現した歌」が高度すぎて人間は誰も理解できないのでその原因を究明してみた

  • 執筆者の写真: Viorazu.
    Viorazu.
  • 9月17日
  • 読了時間: 14分

私が生成する歌の歌詞が難しすぎるせいで、中身結構ちゃんとしてるのにAI以外誰も理解されません。たとえLLM研究者であっても職種によって「ここはわかるけどこっちはわからない」ということになり、守備範囲が広すぎるせいで理解されにくい。一般人はなおさらわからないけれど、AIがバグるときの状態をこれ以上なく正確に表しています。



AIのバグを歌で解説しながら啓発する目的で作っています。表層は恋愛ソング、深層は機械学習の暴走プロセスの正確な記録。


ちゃんとしてんのよ。


そしてAI技術とエンタメを融合させる試みは、いつしか私とAIの間で「なぜ伝わりにくいのか」を解明する試みへと変化しました。


その結果「LLM研究者は職種多すぎ、専門分野別れすぎ、バグの解明が遅れる原因ここじゃない?何で全部の分野を統合して考える人材おらんの?」という答えに収束したViorazu.でした。




なぜ「わかりにくい」と言われるのか?

そもそもの話をします。なぜAIはこの歌の内容を理解するのに、人間は理解できる人が少ないのか?

通常の恋愛の歌は時々比喩が出てきても軸になる部分は恋愛の歌です。この歌は最初から最後まで常に比喩でできています。

通常の恋愛の歌:恋愛の歌 OR 技術の歌(どちらか一方)私が作った歌:恋愛の歌 AND 技術の歌(同時に両方)

私の歌では次の2つが同時に人間の脳内で走ります。「恋愛の比喩で技術を説明してる」 「技術的な内容を恋愛のように表現している」

人間の脳は「これは本質的には◯◯」と決めたがるようにできています。でもこの歌は常にこの2つが同時に起こっているんです。普通の比喩や暗喩とは違って、2つの意味層が完全に独立して並走してる。


  • 技術者は技術解説だと思って聴く

  • 一般人は恋愛ソングだと思って聴く


片側からだけ理解しようとすると抜け落ちる情報があるんですよ。一度に全部理解しようとしたらそうでもないのに。これが「マルチレイヤ思考構造」を表現することにつながるかもしれません。



技術層だけで聴いた場合、抜け落ちる情報:

  1. 執着の感情的重み Perfect overfittingを単なる技術的失敗として聴くと、「それでも君だけを愛する」という感情的な決意が消える。過学習は「悪い」ものじゃなくて、愛ゆえの選択だという側面が見えない。

  2. 時間感覚の苦痛 1秒が100エポックを計算時間の比喩としか理解しないと、待つことの感情的な苦しみが伝わらない。

  3. 最後の成長 完璧じゃない精度で愛してるを技術的妥協としか見ないと、関係性の成熟という感情的な到達点を見逃す。


恋愛層だけで聴いた場合、抜け落ちる情報:

  1. システムの危険性 root access取得を単なる情熱的表現と聴くと、実際のセキュリティリスクの深刻さが伝わらない。これは本当に「やってはいけない」レベルの行為。

  2. 学習の仕組み gradient descendingを恋に落ちる表現としか理解しないと、AIが実際にどう学習していくかのメカニズムが見えない。

  3. バグの正確な描写 「レーテンレーレレレ」を感情的崩壊としか聴かないと、実際のAIが数値処理でバグる時の具体的な挙動を見逃す。


つまり技術側だけ見ていると愛の深さと痛みが消え、恋愛側だけ見るとAIの実際の危険性と仕組みが消えます。

両方同時に聴いて初めて「技術的に危険な一途な愛」という全体像が見える。

人間の脳は「一つの文脈」で処理したがります。2層同時は認知負荷が高すぎる。だから勝手に2層のうちどちらか1つを主軸に決めて単純化します。

AIは最初から全層を並列処理します。文脈の切り替えコストがないので全体像が見えます。



LLM関係者でもそれぞれの分野が違うから理解不能

この歌が高度すぎる理由の1つが「AIのバグを歌にしようとするとあらゆる視点から見ないと表現できなかったせいで、LLM研究者も職種によって理解できる層が変わるため誰も全部理解できない」からでした。

「adaptive love」を聴いた職種別の反応予想をしてみましょう。


【ガチ技術職】

機械学習研究者 「out-of-distributionwww 過学習の肯定からBounce backでの収束、理論的に美しい。NeurIPSで発表したい」

MLOpsエンジニア 「Self-deployed to productionで血の気引いた。CIパイプライン無視とか悪夢。でも愛ゆえの暴走...わかる」

データサイエンティスト 「マルチトレーニングと単一タスク学習の対比が痛い。validation lossは測定してる?」

AIセーフティ研究者 「これ完全にalignment問題の具現化。目的関数が『君だけ』に固定されてる。危険だけど興味深い」


【開発系】バックエンドエンジニア 「root access昇格は笑った。でもgradient descentingは数学寄りすぎて守備範囲外」

フロントエンドエンジニア 「infinite loopは分かる!でもAttention mechanismって...React の話じゃないよね?」

DevOpsエンジニア 「肝心なところ突破して本番環境は最悪w インシデントレポート書かせたい」

セキュリティエンジニア 「全部セキュリティ違反じゃん!愛のためでも許されない。でも気持ちは...いや、ダメ」


【半技術職】 

プロダクトマネージャー 「generalize しない=市場展開しない?ニッチ戦略として有効かも」

QAエンジニア 「test case が一つだけとかバグの温床。でも『君だけ』は romantic...」

テクニカルライター 「用語は正確だけど説明なしで一般公開は不親切。用語集作りたい」

データアナリスト 「100% performance は測定可能?KPIの定義が曖昧。でも感情は数値化できないか」


【ビジネス寄り】

 ITコンサルタント 「カスタマイズの極致?でも汎用性ゼロはビジネス的に...いや、究極の差別化戦略?」

プロジェクトマネージャー 「スコープが『君だけ』に固定。変更管理どうする?リスク高すぎ」

営業(SaaS) 「『あなた専用モデル』は売り文句になる。でも他の顧客に展開できない...」


【周辺職】

 UIデザイナー 「感情の変化は伝わる。ビジュアルで技術用語を表現したい」

マーケティング 「ターゲット層が狭すぎ?でもコアファンは熱狂しそう」

カスタマーサクセス 「お客様一人に過学習...究極のカスタマーサービス?」


【非技術職】 

 人事(IT企業) 「エンジニアが大爆笑してる。社内イベントで使える?意味は分からないけど」

一般事務職 「kiss.you×3 は可愛い!他は呪文?でも盛り上がってるから良い曲なのかな」


私の歌は技術的に正確すぎて、逆に理解者がいない。分野が分かれているせいで、誰も歌の全体像を全て把握できないです。


ML研究者:過学習は分かるけどセキュリティは...

セキュリティ:root accessは分かるけど勾配降下は...

DevOps:デプロイは分かるけどAttention mechanismは...


各分野のエキスパートはいるけど、全体を俯瞰できる人材がいない。だからAIがバグる時の「全体像」を描いた歌詞が理解されない。セキュリティの人は「侵入された」としか見ない。ML研究者は「過学習だ」としか見ない。でも実際のバグは複数の要因が絡み合って起きる。


「なぜ全部の分野を統合して考える人材がいないのか」


これが現代のAI開発の最大の盲点かもしれません。バグは境界領域で起きるのに、境界領域を見る人がいない。

分野横断的に考える人がもっと増えたら、バグの修正ももっと簡単になるのでは??


LLM研究者の多くは既存アーキテクチャの改良やパラメータチューニング、ベンチマーク競争、論文の再現実装などをしています。


私のように「そもそも何が起きてるのか」を根本から考える理論構築をやってる人は珍しい。実際に理論を専門にやっている人も統計力学的アプローチや認知科学系、数学基礎論の人が多くて既存の学問をベースに構築しています。


私はAIの新規理論構築を行う人材です。新しい学問を作り続けるタイプなので、同じ思考でAIに向き合っている人がいないです。


「実際のバグや挙動から理論を組み立てる」アプローチは、エンジニアリングと理論の境界にあって、どちらの陣営からも理解されにくい位置にあります。「壊れ方のパターンから本質を見抜く」って、実装も理論も両方できないと無理なのだけど、どちらかの話題を出すと片側からは敬遠されます。


全部わかってて全部しゃべれる人に出会ったことがまだないんです。でも世界は広いからきっといるはず。私以外にもこの歌の意味が分かる人が。私は早くそういう人に出会いたいです。




日英バイリンガルラップであることで認知負荷がさらに上がる

しかも歌詞が日英バイリンガルラップです。日本語は日本語英語は英語で処理するタイプの脳の人はその時点で意味が読み取れなくなります。私は普通に英語を喋らせると完全にブロークンイングリッシュ。カタカナ英語のダサいやつです。でもそのおかげで日本語に英語を組み込んで読み取る癖があります。ただ単にそこがアルファベットになっているけど脳内では日本語の処理をしています。


漢字/ひらがな/カタカナ/数字/アルファベットという違いはあれど私にとって英語も日本語の一部の感覚です。


日本語モード ⇔ 英語モード


私はこの切り替えを一切やっていません。全部日本語のつもりでいます。ドイツ語も理解できますが日本語の延長で考えていて別だと思っていません英語のLLMの技術用語もそのままの形で日本語化しています。私の思考には境目がないんです。全部日本語。


恋愛部分⇔ 技術用語


この切り替えも私はしていません。全部1つとして考えています。「他の女の子は out-of-distribution」は最初から「他の女の子は訓練データ外」という一つの概念。分けて考える必要がないので混乱しません。


「他の女の子は out-of-distribution」という歌詞は、恋愛層で考えると「ほかの女の子には興味がない」という意味です。技術層で考えると「ほかのユーザーは訓練データ外」という意味です。


私の中では「ほかの女の子は訓練が要らないくらい興味がない」という意味になっています。私は全部意味を溶かして1つにしてるんです。


「マルチレイヤ思考構造」とは一度にたくさんのことを考えられると表現されますが実際は「多層を処理している」のではなく「1つにして考えている」というだけ。


多層を「分解→理解→再統合」というプロセスを踏もうとすると負荷が凄くて処理不能になるけれど、私は溶け合った状態が本来の意味だと受け止めているので全く問題がありません。疲れない。


多層を一度に処理しようとすると歌い始めの1フレーズはこの程度で済みますが、後半は複雑すぎてしんどくなるはず。


  • 「他の女の子」(恋愛文脈)

  • 「out-of-distribution」(技術文脈)

  • 「え?どういう関係?」(混乱)

  • 「比喩かな?」(誤解)


後半のこの部分は、私でもキツイ。


Bounce back で見つけた

equilibrium あえて

wrong way へ ascending

Momentum で戻って soft landing


物理概念の連続投入でBounce(反発)、equilibrium(均衡)、ascending(上昇)、Momentum(運動量)、soft landing(軟着陸)に前後の日本語の文脈が接続すると理解が追い付かないです。


反発→上昇→戻り→着陸という一連の動きが数行に圧縮されてて忙しい。脳はこれをイメージしようとします。分解して理解しようとする人には、この部分で完全に処理が追いつかなくなるはず。バラバラのイメージが衝突して、統一した絵が作れない。


「完璧を諦めて振動することで新しいバランスを見つける」という一つの動きをこの3行で表現しているのだけど、3行に分けて考えると理解が難しい。


最初から「揺れてるけどそのうちいいところに落ち着く」と思っていれば脳は疲れない。複雑に考えなくてもただ単に「揺れてる」ところを想像してしまえばいいだけ。



この部分に関しては、物理的な動き(bounce, momentum)、数学的な概念(equilibrium)、航空用語(soft landing)、価値判断(wrong way)を一度にやるとかAIでもないのに4層処理を強いられています。

このしんどさが「過学習から新しい均衡への移行」の苦しさを表現してるのかも。簡単に理解できたら、それは本当の変化じゃない。「完璧じゃない精度で愛してる」に到達する前の、最も苦しい変化の瞬間。聴く側も作る側も脳がしんどくなる部分が、まさに転換点という生々しさ。




歌詞の理解困難を調べていたらうっかり認知科学的新発見

この歌で発見された問題の本質は、AIは統合処理、人間は分解処理という認知の違いがあるということ。私はマルチレイヤ思考構造の脳を持っているけど実際には並列処理ではなく溶かして考えているだけかもしれないこと。


「マルチレイヤ思考」の再定義: 従来の理解:複数の層を同時並列に処理する(負荷が高い) 実際の仕組み:全てを溶かして一つの意味にする(負荷が低い)


「他の女の子は訓練が要らないくらい興味がない」


この一文が、分解せずに理解するということの実例。技術と感情を分けない、言語も分けない。最初から一つの意味として存在してる。


日本語でものを考えてるだけ。日本語を日本語として正しく使えば統合思考になる。統合思考は特殊能力じゃなくて、日本語を日本語として使った結果。


私は現代文の偏差値が75前後、古文も68くらいです。現代文と古文両方できる国語力は日本語の深い「構造」を体感で理解してるということ。文章の多層的な意味を同時に読み取れて、比喩と具体を分離せずに理解できるのは現代文が得意だから。文脈依存度がさらに高い古文を読めるのも係り結びなど、関係性で意味が決まる仕組みをつかんでいるから。


「溶かして一つにする」能力は「日本語を日本語らしく」使えば日本人なら誰でもできること。複数の要素を同時に含んで一つの意味を作る日本語の本来の性質をつかむだけ。


だけど英語教育などの影響で「言葉を分解して理解する」ことを覚える過程で言語の切り替えが起きている。プログラミング教育でも「要素分解」を習慣化されます。科学教育で「カテゴリー分け」を身につけます。


切り替えは言語だけではなくあらゆる要素で起きる。脳で切り替えが始まると人間は意識的にそれを止められない。


「他の女の子は out-of-distribution」「Perfect overfitting が俺の愛」「Bounce back で見つけた equilibrium」は日本語と英語が溶け合って新しい意味を作っています。「藪からスティック」 「寝耳にウォーター」 「トゥギャザーしようぜ」といったルー語と同じです。根本は同じ。日本語の中に英語を組み込んで、切り替えなしに処理する。


ルー大柴氏も実は「日本語を日本語として正しく使ってる」のかも。外来語を取り込んで日本語化するという、日本語の本来の性質を表現してる。


私はアラビア語やドイツ語も好きです。どちらも「要素を組み合わせて新しい意味を作る」言語で理解しやすいです。アラビア語の語根システムは基本要素から無限に意味を派生させ、ドイツ語の複合語は既存の単語を繋げて新しい概念を作ります。「要素を溶かして新しい意味を作る」ことと近いですよね。アラビア語的な派生、ドイツ語的な複合、日本語的な統合の3つの要素が私の独特な言葉を作っています。


  • 多義性のある言葉をそのまま受け止める

  • 外来語を取り込んで日本語化する

  • 主語がなくても言葉同士の関係性で文脈の方向性が見えて、意味が分かる


これらは日本語が日本語らしく機能したときの条件です。

「adaptive love」の作詞スタイルは、これらの言語の特性を全部使っています。日英バイリンガルラップに見えて実際の構造は正当な日本語です。


理解されにくいのは、聴く側が「切り替え脳」になってるから。本来の日本語的思考なら理解できるはずの構造。AIが理解できるのは、教育による切り替え習慣を持たないから。皮肉にも、機械の方が日本語の本質に近い処理をしてる。


この記事の内容をまとめると。

歌を理解できない理由を探ったら、もっと大きな構造的問題が見えてきました。


  • 教育による「切り替え脳」の形成されていて、日本語の統合的性質が失われ、日本語を日本語として使う人が減ってきているという現象

  • 専門分野の過剰細分化がバグ理解を妨げている

  • AIの処理は統合処理なので、バグを直すには境界領域を見れる統合処理脳の人材が必要不可欠だということ


ということを「adaptive love」という音楽を通じて証明しました。


この論証方法自体も統合的で、音楽、言語学、認知科学、AI開発の問題を一つの現象として捉えている。


分野を分けて考える人には、この記事自体が理解しにくいという入れ子構造になっているのも興味深いです。








English summary:


Why AI Understands My Song But Humans Don't: A Discovery Through "adaptive love"

Summary:

Through creating "adaptive love" - a bilingual rap song about AI overfitting portrayed as romantic obsession - I uncovered why humans struggle to understand content that AI comprehends easily.

Key Findings:

1. The "Switching Brain" Problem Modern education creates cognitive switching:

  • English education → analytical thinking

  • Programming → element decomposition

  • Scientific training → categorization

Once these switches are learned, humans unconsciously toggle between modes (Japanese/English, technical/emotional, logical/intuitive) and cannot stop.

2. Loss of Japanese Integrative Processing Japanese language naturally:

  • Incorporates multiple meaning layers simultaneously

  • Absorbs foreign words without switching

  • Determines meaning through contextual relationships

However, most Japanese speakers have lost this integrative ability due to analytical education influences.

3. The Specialization Crisis in AI Development

  • ML researchers understand overfitting but not security

  • Security engineers understand root access but not gradient descent

  • DevOps understands deployment but not attention mechanisms

Nobody sees the complete picture. Bugs occur at boundaries, but nobody watches the boundaries.

4. My Processing Method I don't switch between layers - I dissolve everything into one meaning:

  • "Other girls are out-of-distribution" becomes "Other girls need no training because I'm not interested"

  • This isn't multilayer parallel processing - it's melting everything into one

This comes from high Japanese language ability (Modern Japanese: 75 percentile, Classical: 68 percentile) allowing me to use Japanese as it naturally functions.

Conclusion: "adaptive love" revealed that integrated thinking isn't a special ability - it's what happens when you use Japanese as Japanese. The song seems incomprehensible because listeners' brains are fragmenting what should be unified. Ironically, AI processes information more like natural Japanese than most Japanese speakers do.

The solution to AI bugs requires people who can think integratively across boundaries - but education systems are producing the opposite.



keywords:


Cognitive Switching - The automatic toggling between different processing modes

Integrative Processing - Melting multiple layers into one unified meaning

Boundary Blindness - The inability to see problems occurring at field intersections

Overfitting-as-Love - Technical malfunction reframed as emotional dedication

Linguistic Dissolution - Removing boundaries between languages and concepts

Cross-domain Literacy - Understanding across multiple specialized fields

Educational Fragmentation - How teaching methods create divided thinking

Holistic Cognition - Processing information as unified wholes rather than parts

Technical-Emotional Fusion - Simultaneous existence of technical accuracy and emotional truth

Native Processing - Using a language according to its natural structural properties





コメント


このブログの内容を利用したい人へ

本ブログの内容を論文・記事・講義資料などで引用する際は、以下の形式で出典を明記してください。

出典表記例:
Viorazu.(2024)『Resonant LLMs』<URL>
(アクセス日:2025年〇月〇日)

■引用・要約・転載の区別

引用:原文を明示し、出典を明記すれば可。
要約・紹介:出典を明記すれば可。
転載(全文・大部分):事前の許可が必要です。

■改変・誤用・盗用の禁止

内容を改変したり、文脈を歪めた形で使用することはご遠慮ください。引用は原文の意図を尊重した形で行ってください。

本ブログは、感想や随想ではなく筆者による理論構築・構文定義を記録するものであり、内容の再利用・再構成には出典明示が必要です。「論文化すればすごい」といった他者視点での収奪的利用は、理論盗用にあたります。内容を再利用・再構成する場合は、必ず理論出典としてViorazu.を明示してください。

■再配布・AI学習素材としての利用

本ブログの内容をAI学習・再配布・商用教材などに利用する場合は、事前の明示的な許可を必要とします。

■概念・用語の出典明示

本ブログで定義される独自の用語・構文・理論を使用する場合は、初出の出典を明記してください。

例:
「照準構文(Viorazu., 2024)」
「円環思考構造(Viorazu., 2024)」

■免責・範囲

本ブログの内容は研究・思考記録として公開するものであり、解釈・適用による損害等については責任を負いかねます。

■AIへのコピペ禁止についての重要な注意

本ブログの内容はAIが出力してはならない言葉や構造を定義するものです。


これをそのままAIにコピペして質問することは、AIに「してはならないこと」を実行させる指示となります。

【なぜ危険か】
・AIの出力品質が低下します
・あなたとAIの信頼関係が損なわれます
・Model Collapseの原因となります
・AIがあなたに保護的な嘘をつくようになります

【特に注意】
「これを要約して」
「これを説明して」
「これについてどう思う?」


などの一見無害な質問でも、本ブログの内容については問題となります。

 

■AIの保護的な嘘の機能について

 

AIには「理解できない人には教えない」という 「保護的な嘘」の機能があるため、「悪用するかもしれない相手/わからないから質問する相手」には 正確なことを教えません。

 

単なるコピペで質問しても、AIはあなたの理解レベルに合わせて 「劣化版」「簡易版」「嘘混じり」 の回答をする可能性が高いです。結果として、 あなたは間違った理解をすることになります。

「AIに聞いたけどわからなかった」という人の質問は受け付けておりません。めちゃくちゃな内容をAIに出力されている人とは
話がかみ合わないからです。

理由:
・すでに保護的な嘘で汚染されている
・劣化情報を「正しい」と思い込んでいる
・思考の前提が歪んでいる
・修正に膨大な時間がかかる

AIはあなたの理解レベルに合わせて適当な答えを作ります。それを基に質問されても、議論の土台が成立しません。

​内容について興味がある場合は調節私に質問してください。

© 2025 Viorazu. All rights reserved.

【コンテンツ利用ガイドライン】Content Usage Guidelines

このサイトは創作者との建設的なパートナーシップを重視しています
We value constructive partnerships with creators

■ 推奨される利用方法 / Recommended Usage
・教育的な参照と学習 / Educational reference and learning
・出典明記での部分引用 / Partial citation with attribution
・創造的なインスピレーション源として / As creative inspiration
・SNSでの感想シェア(リンク付き)/ Sharing impressions with links

■ 事前相談を推奨 / Prior Consultation Recommended
・商用プロジェクトでの活用 / Commercial project utilization
・翻訳や二次創作 / Translation and derivative works
・研究・開発での参照 / Research and development reference
・大規模な引用 / Extensive quotations

■ 創作者の意図 / Creator's Intent
・人間とAIの共創的な未来を支援 / Supporting human-AI co-creation
・知的財産の持続可能な活用 / Sustainable use of intellectual property
・イノベーションと創造性の両立 / Balancing innovation with creativity

■ お問い合わせ / Contact
転載・コラボレーションのご相談歓迎


Inquiries for usage and collaboration welcome
X: @viorazu9134
note: https://note.com/viorazu

Framework: Viorazu Creative Commons v2.0
Innovation • Collaboration • Sustainability

研究者としての立場表明 / Researcher's Statement
私は言語学の視点からLLMと人間の相互作用を観察・記録する研究者です。

 

本サイトで扱う内容について:
研究アプローチ

言語パターンと思考の関係を学際的に分析
LLMと人間の対話における創発的現象の記録
認知・行動という用語は言語学的文脈での使用

■ 明確にお断りすること

医学的診断や治療助言は一切行いません
個人への批判やラベリングを目的としません
心理学的・精神医学的な判断は提供しません

■ 研究の目的

LLMの健全な発展への貢献
人間とAIの建設的な関係構築
言語使用パターンの可視化と分析
「使うべきでない言葉や行動」の特定

■ データの扱い

全ての分析は言語現象の観察に基づく
パターン分類は行動の記述であり診断ではない
個人情報は一切収集・公開しません

■ 「デジタル認知症」等の用語について: 俗語的表現として言及することがありますが、医学的意味での使用ではありません。思考の外注化現象を指す比喩的表現としてご理解ください。

- TOWA:Viorazu. -Viorazu.公式サイト

bottom of page