Sulmi në Meta tregon se siguria e AI-së ka sfida më të thjeshta se Mythos
Më 5 qershor, portal 404 Media ka zbuluar se disa sulmues kishin përdorur agjentin AI të Meta për të marrë kontrollin mbi llogari në Instagram. Metodologjia ishte jashtëzakonisht e thjeshtë: sulmuesit i kërkuan agjentit të lidhë llogaritë me adresa email që kontrollonin ata, dhe agjenti i pajtoi kërkesën. Një sulmues hyri në një llogari të papërdorur të “White House” të presidentit Obama dhe publikoi mesazhe pro-Iran, ndërsa të tjerë morën kontrollin mbi llogari me emra të shkurtër dhe të vlefshëm, ndoshta për t’i shitur.
Këto rreziqe në sigurinë e AI-së nuk janë të reja. Që nga prapasti i prillit, kur Anthropic shpalli se modeli i saj Mythos ishte aq i fuqishëm për të kryer sulme që nuk duhej të lihej në publik, komentatorët, studiuesit dhe zyrtarët federalë u përqendruan në scenarin e një AI të fuqishme që mund të shkatërrojë infrastrukturën kompjuterike. Sulmi në Instagram, megjithatë, tregoi një skenar të ndryshëm: AI-ja ishte viktima, jo sulmuesi, dhe metoda e përdorur ishte shumë më e thjeshtë se çfarë mund të prodhonte Mythos. Siç shpjegon Neil Gong, profesor i inxhinierisë elektrike dhe kompjuterike në Universitetin Duke, “Ndërsa AI po përdoret gjithnjë e më shumë—sidërisht kur përdoret për të automatizuar proceset tona, si rikuperimi i llogarive—mendoj se sulmuesit do të jenë gjithnjë e më të motivuar të sulmojnë vetë AI-në.”
Ekspertë të tjerë, përfshirë Jessica Ji nga Qendra për Sigurinë dhe Teknologjitë e Reja në Georgetown, theksojnë se sulmi nxjerr në pah mungesën e masave mbrojtëse. “A kishin ndonjëherë rregulla mbrojtëse?” pyet ajo, duke vënë në dukje se, për një kompani si Meta, e cila ka ekspertizë të thellë në AI dhe në sigurinë kibernetike, prania e një dobësie kaq të thjeshtë është e habitshme. Meta nuk ka dhënë koment publik në lidhje me mënyrën se si kjo dobësi është kaluar pa u zbuluar, por në një postim në X, një zëdhënës i kompanisë konfirmoi se problemi është i zgjidhur.
Kritikët sugjerojnë masa për të reduktuar rreziqet: ndërtimi i “guardrails” tradicionale që kërkojnë nga agjentët të kërkojnë përgjigje për pyetje sigurie para se të ndryshojnë email-in, dhe kryerja e testimeve të rënda (red‑teaming) për të identifikuar dobësitë para se të lëshohen në prodhim. Sidoqoftë, siç shpjegon Bo Li, profesor i shkencave kompjuterike në Universitetin e Illinois, “siguria dhe funksionaliteti gjithmonë kanë një kompromis”. Për këtë arsye, ndërsa kompanitë synojnë të zhvillojnë agjentë më të fuqishëm, nevojiten burime të mëdha për të mbrojtur ato nga sulmet, veçanërisht kur vlera e synuar, si një emër i shkurtër në Instagram, mund të jetë shumë e lartë.
