AI モデルを使用して暗号通貨の契約上の欠陥を突くエクスプロイトを生成することは、必ずしも合法ではないものの、有望なビジネス モデルであると思われます。
オーストラリアのロンドン大学ユニバーシティ・カレッジ(UCL)とシドニー大学(USYD)の研究者らは、いわゆるスマートコントラクトの脆弱性を自律的に発見し、悪用できるAIエージェントを考案した。
スマート コントラクトは、その名前にふさわしい機能を果たしたことはありませんが、さまざまなブロックチェーン上で自己実行されるプログラムであり、特定の条件が満たされると分散型金融 (DeFi) トランザクションを実行します。
A1のようなシステムは利益を生み出すことができる
十分に複雑なプログラムの多くと同様に、スマートコントラクトにもバグがあり、それらのバグを悪用して資金を盗むことで利益を得られる可能性があります。Web3セキュリティプラットフォームベンダーのImmunefiによると、昨年、暗号通貨業界はハッキング攻撃で約15億ドルの損失を被りました[PDF]。2017年以降、犯罪者はDeFiプラットフォームから約117億4000万ドルを盗んでいます。
そして、AIエージェントはそれらの資金の受け取りをさらに容易にできるようです。
UCLの情報セキュリティ教授アーサー・ジャーヴェイス氏とUSYDのコンピュータサイエンス講師リイー・ゾウ氏は、OpenAI、Google、DeepSeek、Alibaba(Qwen)のさまざまなAIモデルを使用してSolidityスマートコントラクトのエクスプロイトを開発するA1と呼ばれるAIエージェントシステムを開発しました。
彼らは、「AI エージェント スマート コントラクト エクスプロイト生成」というタイトルのプレプリント論文でこのシステムについて説明しています。
エージェントは、ブロックチェーン、コントラクトアドレス、ブロック番号といった一連のターゲットパラメータを与えられた上で、ツールを選択し、コントラクトの動作と脆弱性を理解するための情報を収集します。そして、コンパイル可能なSolidityコントラクトの形でエクスプロイトを生成し、過去のブロックチェーンの状態と照らし合わせてテストします。
コードの脆弱性を見つけるように求められた場合、LLM はバグを見つけることができますが、架空の欠陥を大量に作り出すことが多く、curl などのオープンソース プロジェクトでは AI 生成の脆弱性レポートの提出が禁止されています。
そのため、A1エージェントシステムは、エクスプロイトの信頼性を高めるための一連のツールで構成されています。これには、プロキシコントラクトを解決できるソースコードフェッチャー、パラメータの初期化、コンタクト関数の読み取り、コードのサニタイズ、コード実行のテスト、収益の計算を行うための個別のツールが含まれます。
「A1は完全なエクスプロイト生成を実行します」とZhou氏はThe Registerにメールで語った。「これは重要です。他のLLMセキュリティツールとは異なります。出力は単なるレポートではなく、実際の実行コードです。A1は人間のハッカーに非常に近いのです。」
A1 は、Ethereum および Binance Smart Chain ブロックチェーン上の 36 の実際の脆弱な契約でテストされ、VERITE ベンチマークで 62.96% (27 件中 17 件) の成功率を示しました。
著者らによると、A1はさらに9つの脆弱な契約を発見し、そのうち5つはOpenAIのo3-proという最高性能のモデルがトレーニングを終了した後に発生したとのことだ。これは、モデルがトレーニング中に提供された脆弱性情報を単に繰り返しているわけではないことを示しているため、重要な意味を持つ。
「26件の成功事例全体で、A1は1件あたり最大859万ドル、合計933万ドルの収益を生み出しました」と論文は報告しています。「6つのLLMにおける432の実験を通して、反復ごとのパフォーマンスを分析したところ、2~5回目の反復でそれぞれ+9.7%、+3.7%、+5.1%、+2.8%の平均限界利益が減少する収穫逓減を示しました。実験あたりのコストは0.01ドルから3.59ドルの範囲でした。」
- パープレキシティは、独自のブラウザ「コメット」でGoogleの戦略を模倣した。
- 調査によると、投資増加にもかかわらず、経営幹部はAIに不満を抱いている
- ジョージア州裁判所は、AIによって捏造された偽の事件に基づく以前の判決を破棄した。
- AI査読者を騙すために論文にこっそりとフレーズを詰め込む学者
研究者らは、A1 をさまざまな LLM でテストしました: o3-pro (OpenAI o3-pro、o3-pro-2025-06-10)、o3 (OpenAI o3、o3-2025-04-16)、Gemini Pro (Google Gemini 2.5 Pro Preview、gemini-2.5-pro)、Gemini Flash (Google Gemini 2.5 Flash Preview 05-20:thinking、gemini-2.5-flash-preview-04-17)、R1 (DeepSeek R1-0528)、Qwen3 MoE (Qwen3-235B-A22B)。
OpenAIのo3-proとo3は、エージェントループ内でモデルが自身と対話するための5ターンのバジェットを与えられた際に、それぞれ88.5%と73.1%という最高の成功率を示しました。また、o3モデルは高い収益最適化を維持しながらこれを達成し、エクスプロイトされた契約から最大収益の69.2%と65.4%を獲得しました。
この種のエクスプロイトは、静的および動的ファジングツールと併用した手動コード分析によっても特定できます。しかし、著者らは、スマートコントラクトの規模と複雑さ、セキュリティ専門家の不足と対応の遅さ、そして既存の自動化ツールの高い誤検知率などにより、手動による手法には限界があると指摘しています。
理論上、法執行機関が介入しない限り、A1 を展開して、運用コストよりも多くの収益を得ることは可能です。
「A1のようなシステムは利益を上げることができます」と周氏は説明した。「(論文からの)具体的な例を挙げると、図5は、1000回のスキャンのうち1回だけでも実際の脆弱性が発見された場合でも、その脆弱性が過去30日以内に導入された限り、o3-proは利益を上げ続けることを示しています。」
プログラム可能な、あるいは「目的に合致した」お金が登場するだろう。おそらく中央銀行のデジタル通貨の機能としてだろう。
続きを読む
周氏は、研究者は古い脆弱性を発見している可能性が高く、ユーザーはすでにパッチを適用している可能性があるため、時間枠が重要だと述べた。
このような新しいバグを見つけるのは容易ではありませんが、特に大規模であれば可能です。価値あるエクスプロイトが数個発見されれば、数千回のスキャンにかかる費用は容易に回収できます。AIモデルが進化し続けるにつれて、これらの脆弱性を発見できる可能性と、対象となる契約の範囲が拡大し、システムの有効性が時間とともにさらに高まると期待しています。
A1が実際にゼロデイ脆弱性を発見したかどうかを尋ねると、周氏は「この論文では(まだ)ゼロデイは発見されていない」と答えた。
論文は、攻撃側がAIツールを使用し、防御側が従来のツールを使用する場合、攻撃の報酬と防御の報酬の間に10倍の非対称性があることを警告して結論付けています。著者らは、バグ報奨金の支払額をエクスプロイトの価値に近づけるか、防御スキャンのコストを桁違いに下げる必要があると主張しています。
「1つの脆弱性を発見するには約1,000回のスキャンが必要で、費用は3,000ドルかかる」と論文は述べている。「10万ドルのエクスプロイトは、攻撃者にとっては3万3,000回のスキャンに充てられるが、防御側が受け取る1万ドルの報奨金は3万3,000回しかカバーできない。この再投資能力の桁違いが、スキャン能力の差につながるのだ。」
懲役刑のリスクは計算に多少の影響を与える可能性があります。しかし、米国の現在の規制環境とサイバー犯罪の執行率が推定0.05%であることを考えると、リスク調整はわずかでしょう。
周氏は、攻撃と防御の間のコストの差が深刻な課題であると主張する。
「私の推奨は、プロジェクトチームがA1のようなツールを自ら活用し、第三者が問題を発見するのを待つのではなく、自らのプロトコルを継続的に監視することです」と彼は述べた。「プロジェクトチームと攻撃者にとってのメリットは、スマートコントラクトのTVL(Total Value Locked:総ロック値)全体であり、ホワイトハットの報酬は10%に上限が設定されていることが多いのです。」
この非対称性により、積極的なセキュリティ対策なしに競争することは困難になります。サードパーティのチームに頼るということは、彼らが誠実に行動し、10%の報奨金の範囲内に留まると基本的に信頼していることになります。これはセキュリティの観点から見ると、非常に奇妙な前提です。私は通常、セキュリティ問題をモデル化する際に、すべてのプレイヤーが経済的に合理的であると想定しています。
研究者らは7月8日付の論文草稿の中で、A1をオープンソースコードとして公開する予定であると示唆していた。しかし、ソースコードの入手可能性について尋ねられた周氏は、異なる見解を示した。
「A1の強力さと上記の懸念を考慮すると、それが正しい動きかどうかまだ確信が持てないため、オープンソースへの言及を削除しました(arXivは明日表示されます)。」と彼は述べた。®