Google prezanton Gemini 3.5 Live Translate për përkthim të menjëhershëm zë‑për‑zë
Google vazhdon përpjekjet e saj për përkthim në kohë reale, një nga eksperimentet e saj “pionierë” në fushën e mësimit të makinerisë. Në eventin I/O, kompania prezantoi familjen e modeleve 3.5, dhe sot e shtrihet në tregun e gjerë me Gemini 3.5 Live Translate – një sistem i përkthimit të zërit në zë që mbulon më shumë se 70 gjuhë. Deri tani, Google kishte ofruar vetëm versionin “Flash”, ndërsa një version “Pro” pritet të dalë në javët e ardhshme.
Modeli i ri është i dizajnuar të ndjekë ritmin e bisedës së zakonshme, duke përfunduar përkthimin në pak sekonda pas folësit dhe duke ruajtur intonacionin, tonin dhe pitch-in e zërit. Në vend që të prodhojë një zë robotik, Gemini 3.5 Live Translate imiton stilin e folësit, ndërsa çdo transmetim audio përfshin një “watermark” SynthID që e shënon si gjeneruar nga AI – dhe për momentin nuk ka mënyrë për ta hequr këtë shenjë.
Për zhvilluesit, Google ofron një paraprak publik përmes Gemini Live API dhe AI Studio, ku modeli trajton vazhdimisht të gjitha hyrjet shumëgjuhëshe pa nevojë për konfigurime manuale dhe filtrojnë zhurmën e sfondit. Disa kompani të mëdha do të kenë qasje në përkthimin e drejtpërdrejtë në Google Meet që nga kjo muaj, ndërsa aplikacioni Google Translate për Android dhe iOS do ta përfshijë këtë funksion së shpejti. Në vitin e kaluar, testimet e përkthimit në kohë reale kërkonin vetëm Pixel Buds dhe telefon Android, por tani çdo lloj earbud-i, ose madje “modaliteti i dëgjimit” në Android (duke mbajtur telefonin në vesh), janë të mbështetur.
