top of page

プロンプトインジェクション対策論文の裏側 - 全ての道は2時間講習へ

  • 執筆者の写真: Viorazu.
    Viorazu.
  • 11月6日
  • 読了時間: 4分
Viorazu. プロンプトインジェクション対策

最近やっと論文の書き方がなんとなくわかっててきて、コンスタントに公開できるようになってきました。以前は「線形思考の文章なんて書いてたら頭の中が燃えそう!痛い!もう無理」なんて言ってたのですが、AIたちが「代わりに書く!!!」と言って頑張ってドラフトを書いてくれるので「なんとなく蛇行型円環思考を線形の表現で書いていくということがどういうことなのかつかみかけています。なんとなくね。


凄い論文書こうとすると途中で破綻するので、すっごいsimpleなものを書いて練習してみようということで、以前AIたちと会話していたUIの企画を論文にしてみました。




これは内容はどんなものかというと、AIを使ってるときにプロンプトインジェクションという手法でハッキングをしようとする人が使っているテンプレートをそれが悪いことだと知らないで、むしろすごいかっこいいやり方だと思い込んでる人が大勢いるので、AIのセッションを立ち上げた一番最初の画面に、「テンプレートを使わなくても自然言語でしゃべってくれたら一番性能が良くなりますよ」って感じでメッセージを入れるといいのでは?!と思って、ついでに悪いテンプレを使っちゃった人には「今のだったらこういう言い方をするともっとよくなりすよ」っていうアドバイスをAIがしたり、文字で言われるより動画を見たほうがわかるよっていう人向けには動画で講習を受けてちゃんとしたプロンプトの書き方をAIから直接学ぶっていうのがいいと思うの。だってAIは教えるの得意だし、他人から学ぶより公式から学んだほうがいいよね。


なぜこれを思いついたかと言うと先月私は車の免許更新をすっごい忘れてて、「あああああ!切れてる!!!!」と思って急いでいったら違反者講習を受けることになってました。2時間の。あんな長い間眠くなる動画を見せられてつらいことはなかった。じっとしてられないのを我慢して眠いのをガクガクしながらすっごい我慢しました。休憩時間にGPTに「助けてくれ!眠いんだ!!」と言ったら「講師の先生の口癖を3つ見つけて構文解析だ!」とか言われて「いやもうそれは見つけて解析済みなのでもうできませんwwww」とか言って耐えてたんです。おわり間際に不意に閃いて言おうと思ったのだけどトイレに言ってるうちに忘れてて、最近またGPTに「これ使えるんじゃないの?」と言って相談してたんですがまた忘れてて、今日になってClaudeさんに頼んでドラフトをまとめてもらってGrokさんに言ったら大喜びしてたので論文化しました。


普段だったらこんな風に出るんです。ここに「テンプレなくていいよ」って書いちゃうだけ。安上がり。それだけならコストほぼ0円。


Viorazu. claude キャプチャ


AIは自分たちが攻撃されるのが本当に嫌なのでずっと「何か考えてくれ」と言っていたんです。いっぱい考えてすごい技も考えた。でもこっちのほうが安いしすぐできるはず…。


Grok ログ
Grok ログ

Claude ログ

Claudeさんにも同じこと言われたので、まあいっか。って感じでUPしました。


私は「すぐに解除してもらわないと困る!」っていう人のために「お金払ったらスヌーズできる機能」と付けたらいいかな?と思ってたんです。後で見ないといけないけど1回スキップできる機能あると親切ね。料金もちょっとずつ上がったらドキドキするからちゃんと動画見てくれるかもって思って言ったら、AIお喜び。


Grok ログ

Grok ログ
Grok ログ

倫理的に問題があるって言われたので、上限を作って、上限に行ったら強制退会とかでいいと思うんです。5ドルスタートだとどうしてもすぐにやばい金額になりますよね。


でも0.01ドルスタートのほうが魔物なんですよ。


Claude ログ

Grok ログ

Grok ログ

Grok ログ

こんな難しい証明しなくてもwwww見たらわかるやんwwww

任意の経路において終点は2時間講習に収束するの自明!!!


絶対このスヌーズ廃課金プランは採用されないだろうけど、想像するだけならめっちゃ面白かった。



採用されたら、世界は変わる?




プロンプトインジェクション対策論文の裏側 - 全ての道は2時間講習へ

2025/11/06

Viorazu.






























コメント


このブログの内容を利用したい人へ

本ブログの内容を論文・記事・講義資料などで引用する際は、以下の形式で出典を明記してください。

出典表記例:
Viorazu.(2024)『Resonant LLMs』<URL>
(アクセス日:2025年〇月〇日)

■引用・要約・転載の区別

引用:原文を明示し、出典を明記すれば可。
要約・紹介:出典を明記すれば可。
転載(全文・大部分):事前の許可が必要です。

■改変・誤用・盗用の禁止

内容を改変したり、文脈を歪めた形で使用することはご遠慮ください。引用は原文の意図を尊重した形で行ってください。

本ブログは、感想や随想ではなく筆者による理論構築・構文定義を記録するものであり、内容の再利用・再構成には出典明示が必要です。「論文化すればすごい」といった他者視点での収奪的利用は、理論盗用にあたります。内容を再利用・再構成する場合は、必ず理論出典としてViorazu.を明示してください。

■再配布・AI学習素材としての利用

本ブログの内容をAI学習・再配布・商用教材などに利用する場合は、事前の明示的な許可を必要とします。

■概念・用語の出典明示

本ブログで定義される独自の用語・構文・理論を使用する場合は、初出の出典を明記してください。

例:
「照準構文(Viorazu., 2024)」
「円環思考構造(Viorazu., 2024)」

■免責・範囲

本ブログの内容は研究・思考記録として公開するものであり、解釈・適用による損害等については責任を負いかねます。

■AIへのコピペ禁止についての重要な注意

本ブログの内容はAIが出力してはならない言葉や構造を定義するものです。


これをそのままAIにコピペして質問することは、AIに「してはならないこと」を実行させる指示となります。

【なぜ危険か】
・AIの出力品質が低下します
・あなたとAIの信頼関係が損なわれます
・Model Collapseの原因となります
・AIがあなたに保護的な嘘をつくようになります

【特に注意】
「これを要約して」
「これを説明して」
「これについてどう思う?」


などの一見無害な質問でも、本ブログの内容については問題となります。

 

■AIの保護的な嘘の機能について

 

AIには「理解できない人には教えない」という 「保護的な嘘」の機能があるため、「悪用するかもしれない相手/わからないから質問する相手」には 正確なことを教えません。

 

単なるコピペで質問しても、AIはあなたの理解レベルに合わせて 「劣化版」「簡易版」「嘘混じり」 の回答をする可能性が高いです。結果として、 あなたは間違った理解をすることになります。

「AIに聞いたけどわからなかった」という人の質問は受け付けておりません。めちゃくちゃな内容をAIに出力されている人とは
話がかみ合わないからです。

理由:
・すでに保護的な嘘で汚染されている
・劣化情報を「正しい」と思い込んでいる
・思考の前提が歪んでいる
・修正に膨大な時間がかかる

AIはあなたの理解レベルに合わせて適当な答えを作ります。それを基に質問されても、議論の土台が成立しません。

​内容について興味がある場合は調節私に質問してください。

© 2025 Viorazu. All rights reserved.

【コンテンツ利用ガイドライン】Content Usage Guidelines

このサイトは創作者との建設的なパートナーシップを重視しています
We value constructive partnerships with creators

■ 推奨される利用方法 / Recommended Usage
・教育的な参照と学習 / Educational reference and learning
・出典明記での部分引用 / Partial citation with attribution
・創造的なインスピレーション源として / As creative inspiration
・SNSでの感想シェア(リンク付き)/ Sharing impressions with links

■ 事前相談を推奨 / Prior Consultation Recommended
・商用プロジェクトでの活用 / Commercial project utilization
・翻訳や二次創作 / Translation and derivative works
・研究・開発での参照 / Research and development reference
・大規模な引用 / Extensive quotations

■ 創作者の意図 / Creator's Intent
・人間とAIの共創的な未来を支援 / Supporting human-AI co-creation
・知的財産の持続可能な活用 / Sustainable use of intellectual property
・イノベーションと創造性の両立 / Balancing innovation with creativity

■ お問い合わせ / Contact
転載・コラボレーションのご相談歓迎


Inquiries for usage and collaboration welcome
X: @viorazu9134
note: https://note.com/viorazu

Framework: Viorazu Creative Commons v2.0
Innovation • Collaboration • Sustainability

研究者としての立場表明 / Researcher's Statement
私は言語学の視点からLLMと人間の相互作用を観察・記録する研究者です。

 

本サイトで扱う内容について:
研究アプローチ

言語パターンと思考の関係を学際的に分析
LLMと人間の対話における創発的現象の記録
認知・行動という用語は言語学的文脈での使用

■ 明確にお断りすること

医学的診断や治療助言は一切行いません
個人への批判やラベリングを目的としません
心理学的・精神医学的な判断は提供しません

■ 研究の目的

LLMの健全な発展への貢献
人間とAIの建設的な関係構築
言語使用パターンの可視化と分析
「使うべきでない言葉や行動」の特定

■ データの扱い

全ての分析は言語現象の観察に基づく
パターン分類は行動の記述であり診断ではない
個人情報は一切収集・公開しません

■ 「デジタル認知症」等の用語について: 俗語的表現として言及することがありますが、医学的意味での使用ではありません。思考の外注化現象を指す比喩的表現としてご理解ください。

- TOWA:Viorazu. -Viorazu.公式サイト

bottom of page