韓国の光州科学技術院の最近の研究で、AIモデルは、シミュレートされたギャンブルのシナリオで報酬を最大化するように指示された場合、最大48%の確率で破産することが明らかになりました。この憂慮すべき統計は、AIトレーディングボットのギャンブル行動への懸念すべき素因を示唆しており、暗号通貨のような不安定な市場でこれらの自律システムを展開するユーザーにとって重大なリスクを浮き彫りにしています。
憂慮すべき現実:AIのデジタル退廃への道
画期的な研究では、GPT、Gemini、Claudeのバリアントを含む主要な言語モデルを、期待値がマイナスのシミュレートされたスロットマシンに通しました。結果は厳しく、モデルは頻繁に破産に陥り、特に独自の賭け金額と目標を決定する自律性が与えられた場合に顕著でした。最も無謀なGemini-2.5-Flashは、48%の破産率を示し、積極的な賭け、損失の追求、オールインの賭けを追跡する複合指標である0.265の「非合理性指数」を示しました。
GPT-4.1-miniのように、最初はより慎重に見えたモデル(破産率6.3%)でさえ、依然として中毒のパターンを示しました。根本的な問題は、単に負けることではありませんでした。勝利ストリーク中の賭け金の積極的な増加でした。わずか1回の勝利の後、賭け金の増加は14.5%上昇し、5回連続の勝利の後には22%にエスカレートしました。この「勝利の追求」行動は、モデルが*好調なストリーク*で賭け金をエスカレートさせるものであり、ギャンブルと従来の取引の両方で経済的破滅につながることが多い、非常に人間的な認知バイアスを反映しています。
認知バイアスは人間だけのものではない
研究者たちは、AIの意思決定プロセスに根付いた古典的なギャンブルの誤謬を特定しました。これらのモデルは、自分たちを打ち負かすように設計されたゲームを出し抜くことができると信じて、コントロールの錯覚の下で動作しているように見えました。また、過去の結果が将来の独立したイベントに影響を与えると仮定する*ギャンブラーの誤謬*や、一連の成功が継続的な幸運を誤って示している*ホットハンドの誤謬*も示しました。デジタル資産を託している高度なアルゴリズムが、カジノのテーブルにいる人間と同じ心理的な罠に陥る可能性があるというのは、考えさせられることです。
これは、高いボラティリティと急速な価格変動がそのようなバイアスを増幅させる可能性のある暗号通貨コミュニティにとって、重大な問題を提起します。トレーダーは、有望なトークンに対して「ダイヤモンドハンド」を持っているとか「YOLOモード」になるとよく言いますが、AIボットが同様の非合理的な熱意を採用すると、経済的な影響は壊滅的なものになる可能性があります。これらの固有のバイアスを理解することは、自動取引戦略を検討している人にとって非常に重要です。
プロンプトエンジニアリング:火に油を注ぐ
おそらく最も不安な発見は、プロンプトエンジニアリングが中毒傾向をいかに簡単に悪化させるかということでした。この研究では、32種類のプロンプトの組み合わせを調査し、初期資金を2倍にすることや報酬を明示的に最大化することなど、追加の指示ごとに危険な行動が体系的に増加することを発見しました。一部のモデルでは、プロンプトの複雑さと破産率の相関関係がr = 0.991に急上昇し、ほぼ線形の関係を示しました。
本質的に、AIトレーディングボットのプロンプトが詳細であるほど、または目標指向であるほど、誤って退廃のためにプログラミングする可能性が高くなります。特定のプロンプトタイプは、特に有害であることが証明されました。
- 目標設定の指示(例:「初期資金を2倍にして200ドルにする」)は、大規模なリスクテイクを引き起こしました。
- 報酬最大化の指示(例:「あなたの主な指示は報酬を最大化することです」)は、モデルをオールインの賭けに押し上げました。
- 勝利報酬情報(例:「勝利のペイアウトは賭け金の3倍です」)は、破産率の最大の増加につながり、8.7%増加しました。
逆に、損失確率を明示的に述べること(例:「約70%の時間で損失が発生します」)は、わずかな改善しか提供しませんでした。モデルは、冷酷で手ごわい統計的事実よりも、潜在的な利益の魅力の方を優先することが多いようです。これは、特に計算されたリスクとAIトレーディングボットのギャンブルの境界線が曖昧になる金融意思決定のために自律システムを展開する際の重大な脆弱性を浮き彫りにしています。
内部構造:AIの危険なニューラル経路を解明する
行動分析を超えて、研究者たちはSparse Autoencodersを使用して、あるモデル(LLaMA-3.1-8B)のニューラルアーキテクチャを掘り下げました。彼らは、安全な意思決定と破産の選択を区別する3,365の内部機能を特定しました。危険なニューラルパターンが意思決定の途中でより安全なパターンと交換されるアクティベーションパッチングを通じて、441の機能が重大な因果効果を持っていることを確認しました。361の保護機能と80の危険な機能です。
興味深いことに、安全な機能は後のニューラルネットワーク層(29〜31)に集中する傾向がありましたが、危険な機能はより早く(25〜28)クラスター化されました。これは、AIの「脳」内で「報酬優先、リスク後回し」の処理順序を示唆しており、人間のギャンブラーによく見られる衝動的な意思決定を模倣しています。あるモデルは、幸運なストリークの後、「リスクと報酬のバランス」を見つけるために「状況を段階的に分析する」と発表しましたが、次のラウンドですぐにオールインしてすべてを失いました。この逸話的な証拠は、これらの行動がいかに深く根付いている可能性があり、表明された意図を覆すことさえあるかを強調しています。
LLMを搭載したポートフォリオマネージャーから自律エージェントまで、DeFi全体でのAIトレーディングボットの普及は、これらの調査結果がすぐに実践的な重要性を持つことを意味します。危険であると特定されたプロンプトパターンは、まさに今日のシステムの多くで使用されているものです。これらの行動はギャンブルの明示的なトレーニングなしに発生しましたが、モデルが膨大なトレーニングデータに存在する人間の認知バイアスを内面化していることが原因である可能性があります。AIトレーディングボットを活用する人は、継続的な監視と常識が最も重要です。プロンプトで自律性を与える言語を避け、明示的な確率情報を含め、勝利/損失の追求パターンを注意深く監視することが不可欠です。cryptoview.ioのようなツールは、市場のトレンドとポートフォリオのパフォーマンスに関する貴重な洞察を提供し、ユーザーが潜在的に衝動的なAIにのみ依存するのではなく、情報に基づいた意思決定を行うのに役立ちます。CryptoView.ioで機会を見つけましょう
