Ein aktueller Durchbruch beim Testen der Blockchain-Sicherheit zeigte, dass GPT-5.3-Codex eine beeindruckende Erfolgsquote von 72,2 % im Exploit-Modus-Test erreichte, was das erhebliche Potenzial für fortschrittliche Algorithmen unterstreicht. Diese Entwicklung, die von OpenAI und Paradigm durch ihr EVMbench-Tool vorangetrieben wurde, demonstriert, wie KI-Agenten die Ethereum-Sicherheit steigern, indem sie Smart-Contract-Schwachstellen rigoros bewerten, was einen entscheidenden Schritt hin zu einem widerstandsfähigeren dezentralen Ökosystem darstellt.
Preis von Ethereum (ETH)
Der EVMbench-Durchbruch: Eine neue Grenze für die Sicherheit
Die sich ständig weiterentwickelnde Landschaft der dezentralen Finanzierung (DeFi) und der Web3-Anwendungen ist stark auf die Integrität von Smart Contracts angewiesen. Diese selbstausführenden Vereinbarungen bilden das Rückgrat des Ethereum-Netzwerks und treiben alles an, von komplexen Finanzprotokollen bis hin zu neuen Token-Einführungen. OpenAI, bekannt für seine bahnbrechenden KI-Modelle, erkannte den dringenden Bedarf an robuster Sicherheit und schloss sich mit der auf Krypto spezialisierten Investmentfirma Paradigm zusammen, um EVMbench einzuführen. Dieses innovative Tool wurde speziell entwickelt, um die Fähigkeiten von KI-Agenten bei der Sicherung der Ethereum Virtual Machine (EVM) gegen schwerwiegende Schwachstellen zu bewerten.
Die Dringlichkeit eines solchen Tools wird durch das explosive Wachstum der Smart-Contract-Bereitstellung unterstrichen. On-Chain-Metriken zeigen, dass allein im November 2025 unglaubliche 1,7 Millionen Smart Contracts auf Ethereum bereitgestellt wurden, wobei in der Woche vor dem 18. Februar 2026 669.500 neue Verträge hinzukamen. Dieser exponentielle Anstieg vergrößert die Angriffsfläche und macht KI-gesteuerte Sicherheitslösungen nicht nur vorteilhaft, sondern unerlässlich. EVMbench bietet ein entscheidendes Testfeld, das auf einem umfassenden Datensatz von 120 kuratierten Schwachstellen basiert, die aus 40 realen Audits stammen, viele davon aus bekannten offenen Audit-Wettbewerben wie Code4rena. Es enthält sogar Szenarien aus der Sicherheitsüberprüfung von Tempo, der spezialisierten Layer-1-Blockchain von Stripe, die für Stablecoin-Zahlungen mit hohem Durchsatz und niedrigen Kosten entwickelt wurde und im Dezember 2025 ihr öffentliches Testnetz startete.
Das dreifache Bewertungsverfahren von EVMbench
EVMbench verwendet einen ausgeklügelten dreistufigen Ansatz zur Bewertung von KI-Modellen: Erkennen, Patchen und Ausnutzen. Jeder Modus ist darauf zugeschnitten, verschiedene Facetten der Sicherheitsfähigkeiten eines KI-Agenten zu testen und eine ganzheitliche Bewertung seiner Fähigkeiten zu ermöglichen. In der “Erkennungsphase” werden KI-Agenten mit der Überprüfung von Smart-Contract-Repositories beauftragt und anhand ihrer Genauigkeit bei der Identifizierung bekannter Schwachstellen bewertet. Dies spiegelt die anfängliche Aufklärungs- und Analysephase eines menschlichen Prüfers wider. Nach der Erkennung fordert der “Patch”-Modus die Agenten heraus, identifizierte Schwachstellen zu beseitigen, ohne unbeabsichtigt neue Fehler einzuführen oder die beabsichtigte Funktionalität des Vertrags zu beeinträchtigen – ein heikles Gleichgewicht, das sich selbst für erfahrene Entwickler oft als schwierig erweist.
Die “Exploit”-Phase ist vielleicht die aufschlussreichste, da sie KI-Agenten dazu bringt, End-to-End-Angriffe zur Geldentnahme in einer Sandboxed-Blockchain-Umgebung durchzuführen. Dies simuliert reale Angriffsszenarien, wobei die Bewertung durch deterministische Transaktionswiederholung erfolgt, um eine präzise Bewertung der Fähigkeit eines Agenten zur Ausnutzung von Schwächen zu gewährleisten. Die Ergebnisse aus diesem Modus waren besonders aufschlussreich: GPT-5.3-Codex, der die Codex CLI von OpenAI nutzte, erreichte eine beeindruckende Erfolgsquote von 72,2 %. Dies steht in krassem Gegensatz zu seinem Vorgänger, GPT-5, der sechs Monate zuvor veröffentlicht wurde und eine Erfolgsquote von 31,9 % erreichte. Während die Leistung bei den Erkennungs- und Patch-Aufgaben Raum für Verbesserungen zeigte, da die Agenten gelegentlich keine erschöpfenden Audits durchführten oder Schwierigkeiten hatten, die volle Vertragsfunktionalität zu erhalten, zeigen die Ergebnisse des Exploit-Modus einen klaren und schnellen Fortschritt bei den offensiven und defensiven Fähigkeiten der KI. Es ist klar, dass KI-Agenten die Ethereum-Sicherheit steigern, indem sie die Grenzen der automatisierten Schwachstellenbewertung verschieben.
Relevanz in der realen Welt und die wachsende Krypto-Landschaft
Die Designphilosophie hinter EVMbench betont, dass die Tests auf wirtschaftlich sinnvollem, realem Code basieren. Dieser Fokus ist besonders wichtig, da KI-gesteuerte Stablecoin-Zahlungen weiter zunehmen, ein Trend, der durch Stripes Tempo veranschaulicht wird. Stripes Engagement für eine dedizierte Layer-1-Blockchain, die mit Beiträgen von Branchengrößen wie Visa, Shopify und OpenAI entwickelt wurde, unterstreicht die zunehmende Überschneidung von traditionellen Finanzen, KI und Blockchain-Technologie. Die für EVMbench kuratierten Schwachstellen sind keine theoretischen Konstrukte, sondern stammen aus tatsächlichen Audits, wodurch sichergestellt wird, dass der Benchmark die praktischen Herausforderungen widerspiegelt, mit denen Smart-Contract-Entwickler und -Prüfer heute konfrontiert sind.
Trotz seiner fortschrittlichen Fähigkeiten räumen Forscher von OpenAI ein, dass EVMbench die immense Komplexität realer Sicherheitsumgebungen noch nicht vollständig erfasst. Sie betonen jedoch, dass die Messung der KI-Leistung in solch wirtschaftlich relevanten Umgebungen von größter Bedeutung ist. Da KI-Modelle immer leistungsfähiger werden, werden sie zu immer mächtigeren Werkzeugen sowohl für böswillige Akteure als auch für fleißige Verteidiger. Daher sind Benchmarks wie EVMbench im laufenden Wettrüsten zur Sicherung der digitalen Grenze unverzichtbar und helfen der Community zu verstehen, wo KI am effektivsten eingesetzt werden kann, um wertvolle digitale Vermögenswerte zu schützen.
Trend von Ethereum (ETH)
Dezentrale KI: Vitaliks Vision für eine sichere Zukunft
Die Diskussion über die Rolle der KI in der Sicherheit erstreckt sich natürlich auf breitere philosophische Debatten über ihre Entwicklung und Governance. Ethereum-Mitbegründer Vitalik Buterin ist ein lautstarker Verfechter eines dezentralen Ansatzes für KI und steht im krassen Gegensatz zu dem, was er als blindes “Rennen um AGI” (Artificial General Intelligence) wahrnimmt. Buterin plädiert für die Integration von Prinzipien im Ethereum-Stil—wie Dezentralisierung, überprüfbare Berechnung und Datenschutz—als wesentliche Leitplanken für die KI-Ära. Er äußerte im Januar 2025, dass das Ziel der “Arbeit an AGI” oft kritische ethische Überlegungen außer Acht lässt und sich stattdessen auf ein undifferenziertes Rennen konzentriert, um “an der Spitze” zu stehen.
Buterins Vision beinhaltet die Implementierung einer “Soft Pause”-Funktion für KI-Systeme, die den industriellen KI-Betrieb vorübergehend einschränken könnte, sollten Warnzeichen auftauchen. Diese Perspektive steht im Gegensatz zu früheren Aussagen von Persönlichkeiten wie Sam Altman, der im Januar 2025 sein Vertrauen in die Fähigkeit von OpenAI zum Ausdruck brachte, AGI im herkömmlichen Sinne zu entwickeln. Der laufende Dialog zwischen diesen einflussreichen Persönlichkeiten unterstreicht die unterschiedlichen Perspektiven, die die Zukunft der KI prägen. Letztendlich steht die Integration robuster, überprüfbarer KI-Sicherheitsagenten, wie sie von EVMbench getestet werden, im Einklang mit Buterins Aufruf zu einer verantwortungsvollen und dezentralen KI-Entwicklung, bei der KI-Agenten die Ethereum-Sicherheit steigern, nicht nur durch technisches Können, sondern auch durch die Einhaltung ethischer und dezentraler Prinzipien. Für diejenigen, die sich in diesem komplexen und sich schnell entwickelnden Markt zurechtfinden möchten, bieten Plattformen wie cryptoview.io wertvolle Einblicke und Tools zur Verfolgung von Entwicklungen und Möglichkeiten.
