Lajme

Modeli i ri Fable 5 i Anthropic-it i bllokuar për çështje kibernetike, biologjike dhe kimike

Anthropic ka lansuar të martën modelin e ri Claude Fable 5, i cili përshkruhet si i parë në klasën “Mythos” dhe pretendon të kapërcejë aftësitë e modeleve të mëparshme Opus. Për të parandaluar që teknologjia të përdoret nga aktorë keqbërës, kompania ka vendosur masa të rrepta mbrojtëse që e ndalojnë modelin të përgjigjet në pyetje rreth sigurisë kibernetike, biologjisë dhe kimisë. Në vend të tyre, kërkesat për këto tema dërgohen automatikisht te modeli më i vjetër Claude Opus 4.8, i cili paralelisht sinjalizon përdoruesin se kërkesa është redirektuar.

Safeguard-et janë ndërtuar mbi klasifikues që identifikojnë subjekte të ndaluara dhe përpiqje për “jailbreak”. Gjatë më shumë se 1 000 orë testimesh të ekipit të kuq dhe një programi “bug bounty”, asnjë grup i jashtëm nuk arriti të gjejë një mënyrë universale për të anashkaluar kufizimet e Fable 5. Modeli gjithashtu reziston më mirë ndaj përpjekjeve automatike për “jailbreak” në krahasim me versionet e mëparshme Opus. Anthropic thekson se ka vendosur këto masa “më strikte se ideale”, duke pranuar se ndonjëherë mund të refuzojë kërkesa të pafajshme; gabimet e tilla përbëjnë më pak se 5 % të sesioneve në testime.

Kompania ka shprehur shqetësimin e saj për aftësitë e Mythos 5 për “hacking agjentik”, domethënë ekzekutimin e sulmeve kibernetike të ndërlikuara. Sipas testimeve të Institutit Britanik për Sigurinë e IA-së, versioni “Mythos Preview” arriti rezultate të ngjashme me GPT‑5.5 të OpenAI-së në sfida “Capture the Flag”. Në testin specifik ExploitBench, Mythos 5 arriti 78 % në provat e shfrytëzimit të kodit të cenueshëm, një rritje e ndjeshme nga 40 % e Opus 4.8 dhe 69 % e Mythos Preview.

Për sa i përket biologjisë dhe kimisë, klasifikuesi i ri e ndalon çdo kërkesë në këto fusha, duke argumentuar se aktorë keqbërës me burime të mëdha mund të përdorin pyetje të dukshme të pafajshme për të përparuar kërkime biologjike të rrezikshme. Anthropic e konsideron këtë “shkop dyprerësh”, pasi të njëjtat pyetje mund të jenë të dobishme për profesionistë të sigurisë kibernetike ose studiues biologjikë, por të rrezikshme në duart e keqbërësve. Për të zgjeruar aksesin në model, kompania planifikon të rrisë programin Project Glasswing në bashkëpunim me qeverinë amerikane, duke përfshirë më shumë specialistë të sigurisë kibernetike dhe organizata të shkencave jetësore që do të kenë akses të besuar pa kufizimet në biologji/kimikë, por me mbrojtjen kibernetike ende aktive.

Përdoruesit e API‑ve dhe të shërbimeve Enterprise mund të përdorin Fable 5 me çmimin $10 për milion tokenë hyrës dhe $50 për milion tokenë dalës, çmime që janë 67‑100 % më të larta se ato të GPT‑5.5 të OpenAI-së. Abonimet ekzistuese përfshijnë akses deri më 22 qershor; pas kësaj data përdoruesit do të duhet të blejnë “kredite përdorimi” për të vazhduar përdorimin e modelit. Anthropic shpreson të integrojë Fable 5 në paketat standarde të abonimeve sapo të ketë kapacitet të mjaftueshëm për ta.


Leave a Reply

Your email address will not be published. Required fields are marked *