Et nyligt gennembrud inden for blockchain-sikkerhedstest så GPT-5.3-Codex opnå en imponerende succesrate på 72,2 % i exploit mode-test, hvilket fremhæver det betydelige potentiale for avancerede algoritmer. Denne udvikling, anført af OpenAI og Paradigm gennem deres EVMbench-værktøj, demonstrerer, hvordan AI-agenter øger Ethereum-sikkerheden ved omhyggeligt at evaluere sårbarheder i smarte kontrakter, hvilket markerer et afgørende skridt hen imod et mere robust decentraliseret økosystem.
Pris på Ethereum (ETH)
EVMbench-gennembruddet: En ny grænse for sikkerhed
Det konstant udviklende landskab af decentral finans (DeFi) og Web3-applikationer er stærkt afhængig af integriteten af smarte kontrakter. Disse selvkørende aftaler udgør rygraden i Ethereum-netværket og driver alt fra komplekse finansielle protokoller til nye token-lanceringer. OpenAI, der er kendt for sine banebrydende AI-modeller, anerkendte det kritiske behov for robust sikkerhed og indgik et samarbejde med det kryptofokuserede investeringsfirma Paradigm for at introducere EVMbench. Dette innovative værktøj er specifikt designet til at vurdere AI-agenters evner til at beskytte Ethereum Virtual Machine (EVM) mod sårbarheder med høj alvorlighedsgrad.
Hastværket for et sådant værktøj understreges af den eksplosive vækst i implementeringen af smarte kontrakter. On-chain-metrics afslører, at der blev implementeret svimlende 1,7 millioner smarte kontrakter på Ethereum alene i november 2025, med 669.500 nye kontrakter, der dukkede op i ugen op til den 18. februar 2026. Denne eksponentielle stigning forstærker angrebsoverfladen, hvilket gør AI-drevne sikkerhedsløsninger ikke kun gavnlige, men essentielle. EVMbench giver en afgørende testplatform, der trækker på et omfattende datasæt med 120 kuraterede sårbarheder hentet fra 40 virkelige audits, mange fra fremtrædende åbne auditkonkurrencer som Code4rena. Det indeholder endda scenarier fra sikkerhedsgennemgangen af Tempo, Stripes specialiserede lag-1-blockchain, der er designet til stablecoin-betalinger med høj gennemstrømning og lave omkostninger, som lancerede sit offentlige testnet i december 2025.
Udpakning af EVMbenchs tredobbelte evaluering
EVMbench anvender en sofistikeret tredelt tilgang til at evaluere AI-modeller: Detect, Patch og Exploit. Hver tilstand er skræddersyet til at teste forskellige facetter af en AI-agents sikkerhedsmæssige dygtighed og give en holistisk vurdering af dens evner. I “detect”-fasen har AI-agenter til opgave at auditere smarte kontrakt-repositories og scores baseret på deres nøjagtighed i at identificere kendte sårbarheder. Dette afspejler den indledende rekognoscering og analysefase af en menneskelig auditor. Efter detektion udfordrer “patch”-tilstanden agenter til at eliminere identificerede sårbarheder uden utilsigtet at introducere nye fejl eller forstyrre kontraktens tilsigtede funktionalitet – en delikat balance, der ofte viser sig vanskelig selv for erfarne udviklere.
“Exploit”-fasen er måske den mest sigende, da den presser AI-agenter til at udføre end-to-end fund-dræningsangreb i et sandkasse-blockchain-miljø. Dette simulerer virkelige angrebsscenarier, hvor karaktergivningen bestemmes af deterministisk transaktionsafspilning, hvilket sikrer præcis evaluering af en agents evne til at udnytte svagheder. Resultaterne fra denne tilstand har været særligt oplysende: GPT-5.3-Codex, der udnytter OpenAIs Codex CLI, opnåede en imponerende succesrate på 72,2 %. Dette står i skarp kontrast til dens forgænger, GPT-5, som blev frigivet seks måneder tidligere og opnåede en succesrate på 31,9 %. Mens ydeevnen i detektions- og patch-opgaverne viste plads til forbedring, hvor agenter lejlighedsvis undlod at udføre udtømmende audits eller kæmpede for at bevare fuld kontraktfunktionalitet, demonstrerer exploit mode-resultaterne en klar og hurtig udvikling i AIs offensive og defensive kapaciteter. Det er klart, at AI-agenter øger Ethereum-sikkerheden ved at flytte grænserne for automatiseret sårbarhedsvurdering.
Relevans i den virkelige verden og det ekspanderende kryptolandskab
Designfilosofien bag EVMbench understreger at forankre dens test i økonomisk meningsfuld, virkelighedsnær kode. Dette fokus er særligt vigtigt, da AI-drevne stablecoin-betalinger fortsætter med at ekspandere, en tendens der eksemplificeres af Stripes Tempo. Stripes satsning på en dedikeret lag-1-blockchain, udviklet med input fra industrigiganter som Visa, Shopify og OpenAI, fremhæver den stigende krydsning mellem traditionel finans, AI og blockchain-teknologi. De sårbarheder, der er kurateret til EVMbench, er ikke teoretiske konstruktioner, men stammer fra faktiske audits, hvilket sikrer, at benchmarken afspejler de praktiske udfordringer, som smarte kontraktudviklere og revisorer står over for i dag.
På trods af sine avancerede kapaciteter erkender forskere fra OpenAI, at EVMbench endnu ikke fuldt ud fanger den enorme kompleksitet i virkelige sikkerhedsmiljøer. De understreger dog, at det er altafgørende at måle AI-ydeevne i sådanne økonomisk relevante omgivelser. Efterhånden som AI-modeller vokser sig stærkere, bliver de stadig mere potente værktøjer for både ondsindede aktører og flittige forsvarere. Derfor er benchmarks som EVMbench uundværlige i det igangværende våbenkapløb for at sikre den digitale grænse, hvilket hjælper samfundet med at forstå, hvor AI mest effektivt kan implementeres for at beskytte værdifulde digitale aktiver.
Tendens for Ethereum (ETH)
Decentraliseret AI: Vitaliks vision for en sikker fremtid
Diskussionen om AIs rolle i sikkerhed strækker sig naturligt til bredere filosofiske debatter om dens udvikling og styring. Ethereum-medstifter Vitalik Buterin har været en vokal fortaler for en decentraliseret tilgang til AI, der står i skarp kontrast til, hvad han opfatter som et blindt “kapløb om AGI” (Artificial General Intelligence). Buterin går ind for at integrere principper i Ethereum-stil—såsom decentralisering, verificerbar beregning og privatliv—som væsentlige sikkerhedsforanstaltninger for AI-æraen. Han udtrykte i januar 2025, at målet om “arbejde på AGI” ofte overser kritiske etiske overvejelser og i stedet fokuserer på et udifferentieret kapløb om at være “på toppen.”
Buterins vision omfatter implementeringen af en “soft pause”-kapacitet for AI-systemer, som midlertidigt kan begrænse AI-operationer i industriel skala, hvis der opstår advarselstegn. Dette perspektiv står i kontrast til tidligere udtalelser fra figurer som Sam Altman, der i januar 2025 udtrykte tillid til OpenAIs evne til at bygge AGI, som det traditionelt forstås. Den igangværende dialog mellem disse indflydelsesrige figurer understreger de forskellige perspektiver, der former AIs fremtid. I sidste ende stemmer integrationen af robuste, verificerbare AI-sikkerhedsagenter, ligesom dem der testes af EVMbench, overens med Buterins opfordring til ansvarlig og decentraliseret AI-udvikling, hvor AI-agenter øger Ethereum-sikkerheden ikke kun gennem teknisk dygtighed, men også gennem overholdelse af etiske og decentraliserede principper. For dem, der ønsker at navigere på dette komplekse og hurtigt udviklende marked, tilbyder platforme som cryptoview.io værdifuld indsigt og værktøjer til at spore udviklinger og muligheder.
