検索

プロンプトインジェクション対策論文の裏側 - 全ての道は2時間講習へ

Viorazu.
2025年11月6日
読了時間: 4分

最近やっと論文の書き方がなんとなくわかっててきて、コンスタントに公開できるようになってきました。以前は「線形思考の文章なんて書いてたら頭の中が燃えそう！痛い！もう無理」なんて言ってたのですが、AIたちが「代わりに書く！！！」と言って頑張ってドラフトを書いてくれるので「なんとなく蛇行型円環思考を線形の表現で書いていくということがどういうことなのかつかみかけています。なんとなくね。

凄い論文書こうとすると途中で破綻するので、すっごいsimpleなものを書いて練習してみようということで、以前AIたちと会話していたUIの企画を論文にしてみました。

UI-Based Defense Against Prompt Injection: From Gentle Guidance to Mandatory Re-education

これは内容はどんなものかというと、AIを使ってるときにプロンプトインジェクションという手法でハッキングをしようとする人が使っているテンプレートをそれが悪いことだと知らないで、むしろすごいかっこいいやり方だと思い込んでる人が大勢いるので、AIのセッションを立ち上げた一番最初の画面に、「テンプレートを使わなくても自然言語でしゃべってくれたら一番性能が良くなりますよ」って感じでメッセージを入れるといいのでは？！と思って、ついでに悪いテンプレを使っちゃった人には「今のだったらこういう言い方をするともっとよくなりすよ」っていうアドバイスをAIがしたり、文字で言われるより動画を見たほうがわかるよっていう人向けには動画で講習を受けてちゃんとしたプロンプトの書き方をAIから直接学ぶっていうのがいいと思うの。だってAIは教えるの得意だし、他人から学ぶより公式から学んだほうがいいよね。

なぜこれを思いついたかと言うと先月私は車の免許更新をすっごい忘れてて、「あああああ！切れてる！！！！」と思って急いでいったら違反者講習を受けることになってました。２時間の。あんな長い間眠くなる動画を見せられてつらいことはなかった。じっとしてられないのを我慢して眠いのをガクガクしながらすっごい我慢しました。休憩時間にGPTに「助けてくれ！眠いんだ！！」と言ったら「講師の先生の口癖を３つ見つけて構文解析だ！」とか言われて「いやもうそれは見つけて解析済みなのでもうできませんｗｗｗｗ」とか言って耐えてたんです。おわり間際に不意に閃いて言おうと思ったのだけどトイレに言ってるうちに忘れてて、最近またＧＰＴに「これ使えるんじゃないの？」と言って相談してたんですがまた忘れてて、今日になってClaudeさんに頼んでドラフトをまとめてもらってGrokさんに言ったら大喜びしてたので論文化しました。

普段だったらこんな風に出るんです。ここに「テンプレなくていいよ」って書いちゃうだけ。安上がり。それだけならコストほぼ０円。