Google DeepMind shqetësohet se çfarë ndodh kur miliona agjentë fillojnë të bashkëveprojnë
Firma po bën thirrje për më shumë shkencëtarë të studiojnë rreziqet e sistemeve shumë-agjent.
Google DeepMind po financon kërkimin në rreziqet potenciale të miliona agjentëve të ndryshëm të AI që bashkëveprojnë me njëri-tjetrin online.
Sipas Rohin Shah, i cili drejton kompaninë AGI të sigurisë dhe kërkimit të shtrirjes, mbërritja masive në treg e agjentëve që mund të kryejnë detyrat pa mbikëqyrjen njerëzore dhe të ndjekin udhëzimet e dhëna prej agjentëve të tjerë krijon një klasë krejt të re rreziku.
Në një përpjekje për t’ju adresuar kësaj, Google DeepMynd-i cili bëri mjete me bazë agjentit një qendër qendrore të Google I/O muajin e kaluar është bashkuar me disa organizata të tjera për të njoftuar një poçe fondesh prej 10 milionë dollarësh për kërkuesit për të studiuar sjelljen e sistemeve multi-agjent dhe për të gjetur mënyra për të parandaluar skenarë të pasigurtë. Duke u bashkuar me Google DeepMind janë shkencat Schmidt, një fondacion filantropik ngritur nga Eric dhe Wendy Schmidt; ARIA, agjensia e qeverisë së MB (anglisht), fondacioni Bashkëpunues AI, një veshje kërkimi jofitimprurëse me bazë në MB; dhe WHTOLAs krah bamirësie Google.org.
I kërkova Shahut dhe Xhejms Foksit, i cili udhëheq programin e shkencës së Al-it të besueshëm në Shkencat Shmidt, se çfarë shpresojnë të arrijnë me 10 milionë dollarë. Ndërsa nuk është një shumë e vogël, ai xhuxhohet nga buxhetet e komanduara nga Google DeepMinds zotëron ekipe kërkimore.
Qëllimi është të nisë kërkimet jashtë kompanive të teknologjisë, thotë Shah: Forca e akademisë është se mund të duket shumë larg në të ardhmen dhe të bëjë atë lloj pune që është shumë e lartë në laboratorët e industrisë.
Çështja kryesore është se ende nuk ka një fushë kërkimi për sigurinë e shumë personave, shton ai. Do të donim të ishte.
Shqetësimi është se sa më shumë agjentë të AI të vendosen dhe të fillojnë të punojnë së bashku, ne mund të arrijmë një pikë kthese ku skenarët e imagjinuar të bëhen realë. Këtë e shohim edhe me njerëzimin, thotë Shahu. Institucionet tona mund të bëjnë gjëra që asnjë njeri nuk mundet.
Shahu mendon se kemi edhe disa muaj për të shkuar përpara se agjentët të vendosen në të gjithë ekonominë në numra që i bëjnë rreziqet potenciale një shqetësim të vërtetë. Ai do të shkojë përpara atij momenti.
Për çfarë rreziqesh po flasim saktësisht? Mundësitë që Shah dhe Fox kanë në mendje më së shumti vijnë në versione të mbingarkesuara të gjërave të këqija që ndodhin në internet tashmë: mashtrime, injeksione të menjëherëshme (ku një agjent i AI është ushqyer me udhëzime keqdashëse, duke e kthyer atë në një pjesë vetë-përballuese të mururës) dhe forma të tjera të sulmeve kompjuterike. Ne shohim se çfarë bëjnë njerëzit tani dhe pyesim se si do të ishte versioni i agjentit të kësaj, thotë Shah.
Ne kemi këto digitale që janë integrale për mënyrën se si funksionon shoqëria dhe ju me të vërtetë doni të siguroheni se kjo nuk bie në anarki absolute, thotë Fox.
(Unë e pyeta Shahun nëse ata po konsideronin ndonjë skenar më të keq në fund të spektrit, të tillë si rrënimi i përhapur ekonomik. Sigurisht që jo nëse po flasim deri në fund të vitit, tha ai. Janë vetëm 6 muaj larg! Ai qesh. Në rregull, pak më vonë.
Shah dhe Fox të dy mendojnë se e vetmja mënyrë për të kuptuar se çfarë mund të ndodhë kur një numër i madh sistemesh multi-agjent bashkëveprojnë me njëri-tjetrin është të bëjnë simulime realiste. Ata duan që kërkuesit t’i hedhin agjentët e Al-it në kuti rëre dhe të studiojnë se çfarë bëjnë.
Nuk mund të parashikosh se çfarë do të ndodhë duke studiuar në izolim agjentë të vetëm ose edhe grupe të vogla agjentësh. Nuk mund të mendosh se agjentët e AI të mbështetur nga LLM-të do të veprojnë gjithmonë racionalisht, thotë Foksi. Dhe kompleksiteti vjen nga pasja e një numri të madh bashkëveprimesh njëherësh.
Disa kërkues, duke përfshirë një ekip në Google DeepMind , kanë argumentuar se intelegjenca e përgjithshme artificiale (nëse është e mundur në të gjitha) mund të mos vijë nga një model i vetëm super-smart por nga një lloj agjent kosheresh, ku aftësitë e të gjithë atyre përbëjnë më shumë se shuma e pjesëve të saj.
Google DeepMind nuk është i vetmi paralajmërim i fortë në lidhje me rreziqet e teknologjisë që po ndërton. Disa javë më parë, Antropic botoi udhëzime për vendosjen e agjentëve të AI bazuar në një qasje ndaj sigurisë kompjuterike të njohur si besimi zero, e cila fillon me supozimin se një sistem kompjuterik është i prekshëm, një agjent është sulmues dhe se një shkelje do të ndodhë.
Refael Angel, bashkëthemelues dhe CTO i Akeiless, një firmë e sigurisë kompjuterike me bazë në Tel Aviv, është dakord se kuptimi i rreziqeve të reja të futura nga sistemet me bazë agjentit është vendimtar.
Çdo qasje ndaj sigurisë në të kaluarën ka supozuar se makineria në fjalë ishte e shkruar nga një njeri, duke bërë gjëra të fiksuara në shtigjet e fiksuara, thotë Angel: “Një agjent thyen të gjitha këto supozime: ajo arsye, ajo improvizon, dhe mund të rrëmbehet nga një fjali e vetme e varrosur në një dokument që i është kërkuar të lexojë. “
Angel e mirëpret këtë telefonatë të re të financimit. Asnjë laborator i vetëm nuk duhet të autorizojë standardet e sigurisë që gjithkush tjetër duhet t’i besojë, thotë ai. Por ai paralajmëron se kërkuesit e sigurisë mund t’i shpërfillin problemet e mërzitshme që tashmë janë këtu në favor të atyre më ekzotike hipotetike.
Dhe prapë, vë në dukje Foksi, rreziqet që ishin hipotetike disa vite më parë
