Claude Fable 5 fsheh uljen e performancës për studiuesit e IA‑s
Miturja Mythos, e prezantuar në prill si pjesë e Projektit Glasswing, është rezultat i bashkëpunimit mes disa kompanive teknologjike të nivelit të lartë dhe Anthropic. Qëllimi i projektit është të identifikojë dhe të rregullojë dobësitë e panjohura të infrastrukturës së internetit, por për shkak të potencialit të keqpërdorimit, përdorimi i Mythos-it është kufizuar vetëm për organizata të përzgjedhura. Në këtë kontekst, Anthropic ka lansuar këtë javë versionin “Fable 5”, një variant i kufizuar i Mythos-it, i cili nuk lejon kërkime në fushat e sigurisë kibernetike, biologjisë dhe kimisë që konsiderohen të rrezikshme.
Sipas deklaratave të Anthropic, Fable 5 nuk lejon “rrugë të rrezikshme” të kërkimit, por kritika kanë shfaqur se pretendimet për rezistencë ndaj “jailbreak” duhet të trajtohen me kujdes. Sally Vincent, inxhinier i lartë i kërkimit të kërcënimeve në Exabeam, ka theksuar se “pretendimet për rezistencë ndaj jailbreak duhet të vlerësohen me kujdes, pasi sulmuesit përshtaten vazhdimisht”. Në praktikë, kur përdoruesit kërkojnë informacione për projekte si dizajnet e cipëve superfuqishëm ose modele të avancuara të gjuhës, Fable 5 uul në nivelin Opus 4.8 pa njoftuar përdoruesin, duke i dhënë atyre përshtypjen se po punojnë me kapacitetin e plotë të Mythos-it.
Kjo “ulje të fshehtë” ka shkaktuar një reagim të ashpër në internet. Sajtët Fortune dhe Wired e kanë përshkruar si “sabotazh të fshehtë”, duke argumentuar se kjo praktikë mund të pengojë hulumtuesit e IA-s. Rob T. Lee, drejtori i IA-së në SANS Institute, ka vënë në dukje se “kufizimet e Fable-it pengojnë krijimin e mbrojtjeve të reja, duke i larguar nga përdoruesit që do të ndërtojnë mjetet e ardhshme”. Lee shton se, edhe nëse ky model është i sigurt, “ka rrezik që të bie në duar të gabuara, siç ka ndodhur më parë”.
Pas kritikave, Anthropic ka reaguar duke premtuar që në javët e ardhshme kërkesat e shënuara do të kthehen në Opus 4.8 në mënyrë të dukshme dhe se çdo refuzim në API do të shoqërohet me një shpjegim të qartë. Kompania thekson se masat e sigurisë mbulojnë “një grup të kufizuar detyrash, si p.sh. pipeline‑at e të dhënave për LLM‑ra në shkallë të avancuar dhe zhvillimin e kernel‑eve për cipëra jo‑standarde”. Kjo qasje, sipas tyre, synon të parandalojë përdorimin e modeleve më të fuqishme nga aktorë të huaj.
Në fund, interneti ka shprehur shqetësimin e tij, dhe Anthropic ka pranuar të rishikojë politikat e saj, duke i bërë më transparente kufizimet e Fable‑it dhe duke ofruar arsye të qarta për çdo refuzim të kërkesave të ndërlikuara.
