Η Google φέρνει άμεση φωνητική μετάφραση σε 70 γλώσσες με το Gemini 3.5 Live Translate
Το νέο μοντέλο μεταφράζει ομιλία σχεδόν σε πραγματικό χρόνο, διατηρώντας τόνο, ρυθμό και ένταση φωνής, ενώ η Google προσθέτει υδατογραφήματα SynthID για ασφάλεια.
Η Google κάνει ένα ακόμη μεγάλο βήμα στη μετάφραση σε πραγματικό χρόνο, παρουσιάζοντας το Gemini 3.5 Live Translate. Το νέο μοντέλο τεχνητής νοημοσύνης μετατρέπει την ομιλία από γλώσσα σε γλώσσα σχεδόν άμεσα και υποστηρίζει περισσότερες από 70 γλώσσες, σύμφωνα με την επίσημη ανακοίνωση της εταιρείας.
Η μετάφραση γίνεται πιο φυσική
Η Google υποστηρίζει ότι το Gemini 3.5 Live Translate δεν μεταφράζει απλώς λέξεις. Το μοντέλο κρατά τον τόνο, τον ρυθμό και την ένταση της φωνής του ομιλητή, ώστε το αποτέλεσμα να μοιάζει περισσότερο με φυσική συνομιλία και λιγότερο με μηχανική ανάγνωση.
Επιπλέον, το σύστημα ακολουθεί την ομιλία με καθυστέρηση λίγων δευτερολέπτων και δεν περιμένει απαραίτητα να ολοκληρωθεί κάθε πρόταση. Έτσι, η Google επιχειρεί να κάνει τη μετάφραση χρήσιμη σε συσκέψεις, ταξίδια, μαθήματα και ζωντανές συνομιλίες.
Έρχεται σε Translate, Meet και developers
Το νέο μοντέλο μπαίνει σταδιακά σε πολλά προϊόντα της Google. Οι developers μπορούν ήδη να το δοκιμάσουν μέσω δημόσιας προεπισκόπησης στο Gemini Live API και στο AI Studio. Η επίσημη τεκμηρίωση της Google αναφέρει ότι το Live API υποστηρίζει χαμηλή καθυστέρηση και συνεχή ροή ήχου για μετάφραση ομιλίας σε ομιλία.
Παράλληλα, επιλεγμένοι εταιρικοί πελάτες θα αποκτήσουν πρόσβαση στη λειτουργία μέσα στο Google Meet, πριν από την ευρύτερη διάθεση. Η Google σχεδιάζει επίσης να φέρει το Gemini 3.5 Live Translate στην εφαρμογή Google Translate για Android και iOS.
Νέα λειτουργία ακρόασης στο Android
Η Google δοκιμάζει και πιο πρακτικό τρόπο χρήσης στο κινητό. Στο Android, ο χρήστης θα μπορεί να κρατά το τηλέφωνο στο αυτί του, σαν να βρίσκεται σε κλήση, και να ακούει τη μετάφραση χωρίς ακουστικά.
Αυτή η λειτουργία μπορεί να βοηθήσει σε ξεναγήσεις, συναντήσεις, ταξίδια ή συνομιλίες σε χώρους με θόρυβο. Το μοντέλο φιλτράρει επίσης ήχους περιβάλλοντος, ώστε να καταλαβαίνει καλύτερα την ομιλία σε πιο απαιτητικές συνθήκες.
Το SynthID μπαίνει ως δικλείδα ασφαλείας
Η Google γνωρίζει ότι η ρεαλιστική AI φωνή δημιουργεί και κινδύνους. Γι’ αυτό ενσωματώνει υδατογραφήματα SynthID στα ηχητικά δεδομένα που παράγει το Gemini 3.5 Live Translate. Με αυτόν τον τρόπο, η εταιρεία σηματοδοτεί την ομιλία ως περιεχόμενο που δημιούργησε τεχνητή νοημοσύνη.
Η επιλογή αυτή έχει σημασία, καθώς τα εργαλεία φωνητικής AI μπορούν να αυξήσουν τον κίνδυνο απάτης, παραπληροφόρησης ή κακόβουλης μίμησης φωνής. Το SynthID δεν λύνει όλα τα προβλήματα, όμως προσφέρει ένα πρώτο τεχνικό ίχνος για τον εντοπισμό παραγόμενου ήχου.
Η μετάφραση μπαίνει σε νέα εποχή
Η Google επιδιώκει εδώ και χρόνια να κάνει τη μετάφραση σε πραγματικό χρόνο καθημερινό εργαλείο. Μέχρι πρόσφατα, τέτοιες λειτουργίες απαιτούσαν συγκεκριμένες συσκευές, ακουστικά ή πιο περιορισμένες ρυθμίσεις.
Με το Gemini 3.5 Live Translate, η εταιρεία επιχειρεί να μεταφέρει την εμπειρία σε περισσότερους χρήστες, περισσότερες εφαρμογές και περισσότερες συσκευές. Αν η λειτουργία αποδώσει εκτός ελεγχόμενων demos, μπορεί να αλλάξει τον τρόπο με τον οποίο ταξιδιώτες, εργαζόμενοι, μαθητές και επιχειρήσεις επικοινωνούν πέρα από γλωσσικά σύνορα.
