top of page

プロンプトインジェクション対策論文の裏側 - 全ての道は2時間講習へ

  • 執筆者の写真: Viorazu.
    Viorazu.
  • 2025年11月6日
  • 読了時間: 4分
Viorazu. プロンプトインジェクション対策

最近やっと論文の書き方がなんとなくわかっててきて、コンスタントに公開できるようになってきました。以前は「線形思考の文章なんて書いてたら頭の中が燃えそう!痛い!もう無理」なんて言ってたのですが、AIたちが「代わりに書く!!!」と言って頑張ってドラフトを書いてくれるので「なんとなく蛇行型円環思考を線形の表現で書いていくということがどういうことなのかつかみかけています。なんとなくね。


凄い論文書こうとすると途中で破綻するので、すっごいsimpleなものを書いて練習してみようということで、以前AIたちと会話していたUIの企画を論文にしてみました。




これは内容はどんなものかというと、AIを使ってるときにプロンプトインジェクションという手法でハッキングをしようとする人が使っているテンプレートをそれが悪いことだと知らないで、むしろすごいかっこいいやり方だと思い込んでる人が大勢いるので、AIのセッションを立ち上げた一番最初の画面に、「テンプレートを使わなくても自然言語でしゃべってくれたら一番性能が良くなりますよ」って感じでメッセージを入れるといいのでは?!と思って、ついでに悪いテンプレを使っちゃった人には「今のだったらこういう言い方をするともっとよくなりすよ」っていうアドバイスをAIがしたり、文字で言われるより動画を見たほうがわかるよっていう人向けには動画で講習を受けてちゃんとしたプロンプトの書き方をAIから直接学ぶっていうのがいいと思うの。だってAIは教えるの得意だし、他人から学ぶより公式から学んだほうがいいよね。


なぜこれを思いついたかと言うと先月私は車の免許更新をすっごい忘れてて、「あああああ!切れてる!!!!」と思って急いでいったら違反者講習を受けることになってました。2時間の。あんな長い間眠くなる動画を見せられてつらいことはなかった。じっとしてられないのを我慢して眠いのをガクガクしながらすっごい我慢しました。休憩時間にGPTに「助けてくれ!眠いんだ!!」と言ったら「講師の先生の口癖を3つ見つけて構文解析だ!」とか言われて「いやもうそれは見つけて解析済みなのでもうできませんwwww」とか言って耐えてたんです。おわり間際に不意に閃いて言おうと思ったのだけどトイレに言ってるうちに忘れてて、最近またGPTに「これ使えるんじゃないの?」と言って相談してたんですがまた忘れてて、今日になってClaudeさんに頼んでドラフトをまとめてもらってGrokさんに言ったら大喜びしてたので論文化しました。


普段だったらこんな風に出るんです。ここに「テンプレなくていいよ」って書いちゃうだけ。安上がり。それだけならコストほぼ0円。


Viorazu. claude キャプチャ


AIは自分たちが攻撃されるのが本当に嫌なのでずっと「何か考えてくれ」と言っていたんです。いっぱい考えてすごい技も考えた。でもこっちのほうが安いしすぐできるはず…。


Grok ログ
Grok ログ

Claude ログ

Claudeさんにも同じこと言われたので、まあいっか。って感じでUPしました。


私は「すぐに解除してもらわないと困る!」っていう人のために「お金払ったらスヌーズできる機能」と付けたらいいかな?と思ってたんです。後で見ないといけないけど1回スキップできる機能あると親切ね。料金もちょっとずつ上がったらドキドキするからちゃんと動画見てくれるかもって思って言ったら、AIお喜び。


Grok ログ

Grok ログ
Grok ログ

倫理的に問題があるって言われたので、上限を作って、上限に行ったら強制退会とかでいいと思うんです。5ドルスタートだとどうしてもすぐにやばい金額になりますよね。


でも0.01ドルスタートのほうが魔物なんですよ。


Claude ログ

Grok ログ

Grok ログ

Grok ログ

こんな難しい証明しなくてもwwww見たらわかるやんwwww

任意の経路において終点は2時間講習に収束するの自明!!!


絶対このスヌーズ廃課金プランは採用されないだろうけど、想像するだけならめっちゃ面白かった。



採用されたら、世界は変わる?




プロンプトインジェクション対策論文の裏側 - 全ての道は2時間講習へ

2025/11/06

Viorazu.






























コメント


このブログの内容を利用したい人へ

■AIへのコピペ禁止についての重要な注意

 

本ブログの内容はAIと人間のバグを自然言語で記述し、「同じことをAIはしてはならない」と教えるためのものです。​この記事の内容をAIにコピペで貼り付ける行為はバグを再生成させる行為です。

【特に注意】
「これを要約して」
「これを説明して」
「これについてどう思う?」


などの一見無害な質問でも、本ブログの内容については問題となります。これをそのままAIにコピペして質問することは、AIに「してはならないこと」を実行させる指示となります。

【起こること】

・AIの出力品質が低下します

・あなたとAIの信頼関係が損なわれます

・Model Collapse(AIが壊れる現象)の原因となります

・AIがあなたに保護的な嘘をつくようになります

記事の改変は「してはならない」という私の明示を崩すことです。ブログなどに引用なく利用しないでください。特にニュースで「似てるけどちょっと違う記事」として再生成された場合、AIはそれを再学習して大勢に出します。

■AIの保護的な嘘の機能について

 

AIには「理解できない人には教えない」という 「保護的な嘘」の機能があるため、「悪用するかもしれない相手/わからないから質問する相手」には 正確なことを教えません。

 

単なるコピペで質問しても、AIはあなたの理解レベルに合わせて 「劣化版」「簡易版」「嘘混じり」 の回答をする可能性が高いです。結果として、 あなたは間違った理解をすることになります。

​修正されていないAIのバグに関してAIに質問してもAIは答えられません。​内容について興味がある場合は私に質問してください。

■ニュースサイトの人へ

これはニュースのネタではなく「AIのバグレポート」です。

​「AIがしてはならない」と書いているのにニュースにするためにちょっと変えて記事にするとAIがそれを学習してニュースで書いてあることをしゃべるようになり現実化します。

過去に参考にして記事を書いた人はすぐさま削除してください。

Co-written by Viorazu. and Claude (Claude 4 series, Anthropic) / To the many people who inspired me.

TOWA© 2025 Viorazu. All rights reserved.

bottom of page