Et nylig gjennombrudd innen blokkjedesikkerhetstesting viste at GPT-5.3-Codex oppnådde en imponerende suksessrate på 72,2 % i utnyttelsesmodustesting, noe som fremhever det betydelige potensialet for avanserte algoritmer. Denne utviklingen, ledet av OpenAI og Paradigm gjennom deres EVMbench-verktøy, demonstrerer hvordan AI-agenter øker Ethereum-sikkerheten ved å grundig evaluere sårbarheter i smarte kontrakter, og markerer et viktig skritt mot et mer robust desentralisert økosystem.
Pris på Ethereum (ETH)
EVMbench-gjennombruddet: En ny frontlinje for sikkerhet
Det stadig utviklende landskapet av desentralisert finans (DeFi) og Web3-applikasjoner er sterkt avhengig av integriteten til smarte kontrakter. Disse selvutførende avtalene danner ryggraden i Ethereum-nettverket, og driver alt fra komplekse finansielle protokoller til nye tokenlanseringer. OpenAI, kjent for sine banebrytende AI-modeller, anerkjente det kritiske behovet for robust sikkerhet og samarbeidet med det kryptofokuserte investeringsselskapet Paradigm for å introdusere EVMbench. Dette innovative verktøyet er spesielt utviklet for å vurdere kapasiteten til AI-agenter til å beskytte Ethereum Virtual Machine (EVM) mot sårbarheter med høy alvorlighetsgrad.
Hastigheten for et slikt verktøy understrekes av den eksplosive veksten i distribusjon av smarte kontrakter. On-chain-metrikker avslører at hele 1,7 millioner smarte kontrakter ble distribuert på Ethereum bare i november 2025, med 669 500 nye kontrakter som dukket opp i uken før 18. februar 2026. Denne eksponentielle økningen forsterker angrepsflaten, noe som gjør AI-drevne sikkerhetsløsninger ikke bare fordelaktige, men essensielle. EVMbench gir et avgjørende testområde, som trekker på et omfattende datasett med 120 kuraterte sårbarheter hentet fra 40 virkelige revisjoner, mange fra fremtredende åpne revisjonskonkurranser som Code4rena. Det inkluderer til og med scenarier fra sikkerhetsgjennomgangen av Tempo, Stripes spesialiserte lag-1-blokkjede, designet for stabilcoin-betalinger med høy gjennomstrømning og lave kostnader, som lanserte sitt offentlige testnett i desember 2025.
Utpakking av EVMbenchs trippeltrussel-evaluering
EVMbench bruker en sofistikert tredelt tilnærming for å evaluere AI-modeller: Oppdag, Fiks og Utnytt. Hver modus er skreddersydd for å teste forskjellige fasetter av en AI-agents sikkerhetsdyktighet, og gir en helhetlig vurdering av dens evner. I «oppdag»-fasen får AI-agenter i oppgave å revidere smarte kontraktsdepoter og scores basert på deres nøyaktighet i å identifisere kjente sårbarheter. Dette speiler den innledende rekognoserings- og analysefasen til en menneskelig revisor. Etter oppdagelsen utfordrer «fiks»-modusen agenter til å eliminere identifiserte sårbarheter uten utilsiktet å introdusere nye feil eller forstyrre kontraktens tiltenkte funksjonalitet – en delikat balanse som ofte viser seg vanskelig selv for erfarne utviklere.
«Utnytt»-fasen er kanskje den mest avslørende, da den presser AI-agenter til å utføre ende-til-ende fonds-tømmende angrep i et sandkasse-blokkjede-miljø. Dette simulerer virkelige angrepsscenarier, med gradering bestemt av deterministisk transaksjonsgjentakelse, som sikrer presis evaluering av en agents evne til å kapitalisere på svakheter. Resultatene fra denne modusen har vært spesielt opplysende: GPT-5.3-Codex, som utnytter OpenAIs Codex CLI, oppnådde en imponerende suksessrate på 72,2 %. Dette står i sterk kontrast til forgjengeren, GPT-5, som ble utgitt seks måneder tidligere og klarte en suksessrate på 31,9 %. Mens ytelsen i oppdagelses- og fikseoppgavene viste rom for forbedring, med agenter som av og til unnlot å gjennomføre uttømmende revisjoner eller slet med å bevare full kontraktsfunksjonalitet, demonstrerer utnyttelsesmodusresultatene en klar og rask fremgang i AIs offensive og defensive evner. Det er tydelig at AI-agenter øker Ethereum-sikkerheten ved å flytte grensene for automatisert sårbarhetsvurdering.
Virkelig relevans og det ekspanderende kryptolandskapet
Designfilosofien bak EVMbench understreker å forankre testingen i økonomisk meningsfull, virkelig kode. Dette fokuset er spesielt viktig ettersom AI-drevne stablecoin-betalinger fortsetter å ekspandere, en trend eksemplifisert av Stripes Tempo. Stripes satsing på en dedikert lag-1-blokkjede, utviklet med innspill fra industrigiganter som Visa, Shopify og OpenAI, fremhever det økende skjæringspunktet mellom tradisjonell finans, AI og blokkjedeteknologi. Sårbarhetene som er kuratert for EVMbench er ikke teoretiske konstruksjoner, men er avledet fra faktiske revisjoner, noe som sikrer at referansen gjenspeiler de praktiske utfordringene smarte kontraktutviklere og revisorer står overfor i dag.
Til tross for sine avanserte evner, erkjenner forskere fra OpenAI at EVMbench ennå ikke fullt ut fanger den enorme kompleksiteten i virkelige sikkerhetsmiljøer. De understreker imidlertid at det er avgjørende å måle AI-ytelse i slike økonomisk relevante omgivelser. Etter hvert som AI-modeller blir kraftigere, blir de stadig mer potente verktøy for både ondsinnede aktører og flittige forsvarere. Derfor er referanseverdier som EVMbench uunnværlige i det pågående våpenkappløpet for å sikre den digitale grensen, og hjelper fellesskapet å forstå hvor AI kan distribueres mest effektivt for å beskytte verdifulle digitale eiendeler.
Trend for Ethereum (ETH)
Desentralisert AI: Vitaliks visjon for en sikker fremtid
Diskusjonen rundt AIs rolle i sikkerhet strekker seg naturlig til bredere filosofiske debatter om dens utvikling og styring. Ethereum-medgründer Vitalik Buterin har vært en vokal forkjemper for en desentralisert tilnærming til AI, i skarp kontrast til det han oppfatter som et blindt «kappløp om AGI» (Artificial General Intelligence). Buterin tar til orde for å integrere prinsipper i Ethereum-stil—som desentralisering, verifiserbar beregning og personvern—som essensielle rekkverk for AI-æraen. Han uttrykte i januar 2025 at målet om «arbeid med AGI» ofte overser kritiske etiske hensyn, og fokuserer i stedet på et udifferensiert kappløp om å være «på toppen.»
Buterins visjon inkluderer implementering av en «myk pause»-kapasitet for AI-systemer, som midlertidig kan begrense AI-operasjoner i industriell skala dersom det skulle dukke opp faresignaler. Dette perspektivet står i kontrast til tidligere uttalelser fra personer som Sam Altman, som i januar 2025 uttrykte tillit til OpenAIs evne til å bygge AGI slik det tradisjonelt forstås. Den pågående dialogen mellom disse innflytelsesrike figurene understreker de forskjellige perspektivene som former fremtiden for AI. Til syvende og sist er integreringen av robuste, verifiserbare AI-sikkerhetsagenter, omtrent som de som er testet av EVMbench, i tråd med Buterins oppfordring til ansvarlig og desentralisert AI-utvikling, der AI-agenter øker Ethereum-sikkerheten ikke bare gjennom teknisk dyktighet, men også gjennom overholdelse av etiske og desentraliserte prinsipper. For de som ønsker å navigere i dette komplekse og raskt utviklende markedet, tilbyr plattformer som cryptoview.io verdifull innsikt og verktøy for å spore utviklingen og mulighetene.
