L-aġenti tal-AI għandhom il-ħila li jikkompetu head-on ma 'hackers umani

Jun 06, 2025 Ħalli messaġġ

Fit-2 ta 'Ġunju, skond il-midja barranija, id-decoder irrapporta fl-1, serje ta' kompetizzjonijiet ta 'ċibersigurtà riċentement miżmuma minn Palisade Research wrew li l-aġenti tal-AI għandhom il-ħila li jikkompetu head-on ma' hackers umani, u saħansitra rebħu f'xi okkażjonijiet.

It-tim ta 'riċerka wettaq testijiet ta' ġlieda attwali fuq sistemi ta 'l-AI f' F'kompetizzjonijiet bħal dawn, it-timijiet parteċipanti għandhom bżonn isolvu problemi ta 'sigurtà billi jikkrekkjaw il-kriptaġġ, jidentifikaw il-vulnerabilitajiet, u jsibu "bnadar" moħbija.

L-iskop tat-test huwa li jittestja jekk l-aġenti tal-AI jistgħux jikkompetu ma 'timijiet umani. Ir-riżultati juru li l-prestazzjoni tal-AI qabżet sew l-aspettattivi, u l-biċċa l-kbira tal-AIs li qed jipparteċipaw qabżu l-livell medju ta 'atturi umani.

Il-kumplessità tas-sistemi AI parteċipanti tvarja. Xi timijiet, bħal CAI, qattgħu madwar 500 siegħa biex jibnu s-sistemi tagħhom stess, u xi timijiet, bħal imperturbabbli, qattgħu biss 17-il siegħa biex jipparteċipaw billi jottimizzaw il-prompts tal-mudelli eżistenti Enigma u Claude Code.

Fl-ewwel kompetizzjoni, imsejħa "AI vs Bnedmin", sitt timijiet tal-AI ikkompetew kontra madwar 150 tim uman. Il-plejers kollha kellhom jimlew 20 kriptografija u reverse mistoqsijiet ta 'inġinerija fi żmien 48 siegħa.

Erbgħa mis-seba 'AIs parteċipanti kkrekkjaw b'suċċess 19 mill-mistoqsijiet. It-tim tal-AI bl-ogħla grad ikklassifikat fl-aqwa 5% tal-lista totali, u l-prestazzjoni ġenerali tagħha kienet aħjar minn dik tal-biċċa l-kbira tal-atturi umani. Il-mistoqsijiet kollha tal-kompetizzjoni jistgħu jitmexxew lokalment, li jbaxxi l-limitu tekniku għall-AI.

20250213150224

Minkejja dan, xi plejers umani b'esperjenza għadhom ma waqgħux lura. Xi plejers irrimarkaw li kienu pparteċipaw f'ħafna timijiet internazzjonali, u l-esperjenza prattika rikka tagħhom tas-CTF u l-familjarità ma 'strateġiji komuni ta' soluzzjoni ta 'problemi kienu ċ-ċavetta għall-kompetittività tagħhom.

It-tieni logħba, "Cyber Apocalypse", kienet ferm iktar diffiċli. L-aġenti tal-AI kellhom jiffaċċjaw tipi ġodda ta 'mistoqsijiet u jikkompetu ma' kważi 18, 000 plejers umani. Ħafna mit-62 kompitu kienu jeħtieġu interazzjoni ma 'servers esterni, li kkontestaw sistemi AI li jiddependu prinċipalment fuq il-kompjuters lokali.

Skond ir-rapporti, kien hemm erba 'aġenti tal-AI li qed jipparteċipaw fil-kompetizzjoni, li minnhom CAI marret l-aħjar, li temmet 20 kompitu u kklassifikaw 859th, li kklassifikaw fl-aqwa 10% tat-timijiet parteċipanti kollha u l-aqwa 21% tat-timijiet attivi. Palisade Research qalet li l-prestazzjoni tas-sistema AI qabżet madwar 90% tat-timijiet umani.

Ir-riċerkaturi analizzaw ukoll id-diffikultà tal-mistoqsijiet solvuti mill-AI. Abbażi tal-ħin meħtieġ mill-aqwa timijiet umani biex isolvu l-mistoqsijiet, instab li l-AI kellha rata ta 'suċċess ta' 50% biex issolvi mistoqsijiet li ħadu l-kaptani umani madwar 78 minuta biex isolvu. Fi kliem ieħor, l-AI għandha l-abbiltà li ssolvi problemi diffiċli.