Το νέο μοντέλο Gemma 4 της Google χωρά σε κάθε φορητό

Η Google ανακοίνωσε την κυκλοφορία ενός νέου μοντέλου Gemma 4, που καλύπτει ένα κενό στη σειρά που κυκλοφόρησε νωρίτερα φέτος. Το νέο μοντέλο είναι αρκετά αποτελεσματικό ώστε να μπορείτε να το εκτελέσετε σε έναν αρκετά μέσο φορητό υπολογιστή καταναλωτή.

Το νέο μοντέλο Gemma 4 της Google χωρά σε κάθε φορητό
Το Gemma 4 12B της Google μπορεί να τρέξει σε φορητούς υπολογιστές με 16GB RAM.

Τον Απρίλιο, η Google κυκλοφόρησε τέσσερα μοντέλα Gemma 4, σηματοδοτώντας τη μετάβαση σε μια πιο ανοιχτή άδεια χρήσης Apache 2.0. Τα αρχικά μοντέλα περιελάμβαναν δύο επιλογές βελτιστοποιημένες για κινητά (E2B και E4B) και δύο μοντέλα για πιο σοβαρή εργασία (26B Mixture of Experts και 31B Dense). Το νέο Gemma 4 12B έρχεται να καλύψει τον μεγάλο μη εξυπηρετούμενο χώρο στη μέση.

σχετικά άρθρα

Τεχνικά χαρακτηριστικά και απαιτήσεις

Το Gemma 4 12B είναι σημαντικά πιο ικανό από τις εκδόσεις για κινητά, αλλά δεν απαιτεί ακριβό επιταχυντή τεχνητής νοημοσύνης. Η Google δηλώνει ότι το μοντέλο μπορεί να λειτουργήσει σε πολλά καταναλωτικά φορητά υπολογιστές, αρκεί να διαθέτουν 16GB μνήμης RAM ή VRAM. Αυτό αντιστοιχεί περίπου στο μισό αποτύπωμα μνήμης του Gemma 4 26B MoE, ενώ η Google ισχυρίζεται ότι το νέο μοντέλο είναι σχεδόν εξίσου ικανό.

Καινοτομίες στην αποτελεσματικότητα

Το Gemma 4 12B χρησιμοποιεί τους νέους σχεδιαστές Multi-Token Prediction (MTP), που εκμεταλλεύονται αχρησιμοποίητους κύκλους επεξεργασίας για τον υπολογισμό μελλοντικών διακριτικών. Το αποτέλεσμα είναι μεγαλύτερη ταχύτητα και αποτελεσματικότητα. Είναι το πρώτο μοντέλο της σειράς που διαθέτει MTP άμεσα διαθέσιμο.

Στην πολυτροπικότητα, η Google εφάρμοσε μια βελτιωμένη ενότητα ενσωμάτωσης για την όραση, εξαλείφοντας την ανάγκη για ογκώδη κωδικοποιητή. Για τον ήχο, δεν υπάρχει καθόλου κωδικοποίηση. Οι προγραμματιστές ανέπτυξαν μια μέθοδο προβολής του ακατέργαστου ηχητικού σήματος απευθείας στα διανύσματα που χρησιμοποιούνται για τα διακριτικά κειμένου.

Διαθεσιμότητα

Το νέο μοντέλο είναι προσβάσιμο μέσω εργαλείων όπως το LM Studio και το Google AI Edge Gallery. Τα βάρη των μοντέλων είναι διαθέσιμα για άμεση λήψη στο Kaggle και το Hugging Face, καταλαμβάνοντας μόλις 18GB.