Αν νομίζατε ότι το ChatGPT ήταν ο προορισμός, μάλλον δεν προσέχατε τη διαδρομή. Ο Sam Altman, ο άνθρωπος που κρατάει τα κλειδιά της OpenAI, επέστρεψε στο Stanford για να ρίξει μια «βόμβα» που πέρασε στα ψιλά, αλλά αλλάζει τα πάντα: η αρχιτεκτονική των Transformers, το ίδιο το θεμέλιο πάνω στο οποίο χτίστηκε όλη η σύγχρονη AI, πλησιάζει στο τέλος της. Και αυτό είναι μόνο η αρχή μιας εβδομάδας που είδαμε την Apple να «ζωντανεύει» φωτογραφίες σε 3D και την Mistral να φτιάχνει AI που αυτοδιορθώνεται.
Το «ταβάνι» των Transformers και η επόμενη μέρα
Ο Altman ήταν σαφής. Οι Transformers μας έφεραν ως εδώ, αλλά έχουν ένα δομικό ελάττωμα: το κόστος τους δεν ανεβαίνει γραμμικά, αλλά εκρηκτικά. Αν θέλεις ένα κείμενο δέκα φορές μεγαλύτερο, χρειάζεσαι εκατό φορές περισσότερη υπολογιστική ισχύ. Αυτό είναι το «τείχος» που βρίσκει μπροστά της η βιομηχανία.
Το ενδιαφέρον δεν είναι μόνο ότι αναζητείται η επόμενη αρχιτεκτονική (τύπου Mamba ή κάτι εντελώς νέο), αλλά το πώς θα βρεθεί. Ο Altman πιστεύει ότι τα τρέχοντα μοντέλα είναι ήδη αρκετά έξυπνα ώστε να βοηθήσουν τους ανθρώπους να σχεδιάσουν τον αντικαταστάτη τους. Μπαίνουμε σε έναν κύκλο όπου η AI αναβαθμίζει τον εαυτό της, και όταν αυτός ο τροχός πάρει ταχύτητα, οι εξελίξεις δεν θα είναι πλέον σταδιακές, αλλά αλματώδεις.
Apple Leto: Η φωτογραφία που έγινε κόσμος
Ενώ η OpenAI μιλά για το μέλλον, η Apple παραδίδει εργαλεία. Το μοντέλο Leto που παρουσίασε είναι εντυπωσιακό στην απλότητά του: του δίνεις μία και μόνο φωτογραφία ενός αντικειμένου και αυτό ανακατασκευάζει ένα πλήρες τρισδιάστατο μοντέλο.
Δεν μιλάμε για ένα «ψεύτικο» 3D. Το Leto κατανοεί πώς πέφτει το φως, πώς δημιουργούνται οι σκιές και οι αντανακλάσεις από κάθε γωνία. Εκπαιδεύτηκε σε χιλιάδες αντικείμενα με εκατοντάδες διαφορετικούς φωτισμούς, μαθαίνοντας τελικά να «μαντεύει» τη δομή του φυσικού κόσμου. Αυτό ξεφεύγει από το δημιουργικό κομμάτι· είναι η απόδειξη ότι η AI αρχίζει να αντιλαμβάνεται τη φυσική πραγματικότητα και όχι μόνο τα pixel.
Από το Chat στην Πράξη: Οι AI Agents είναι εδώ
Η μεγαλύτερη αλλαγή που βιώνουμε αυτή τη στιγμή είναι η μετάβαση από το «μίλα μου» στο «κάνε το».
-
My Computer (Manis): Ένας AI πράκτορας που τρέχει τοπικά στο PC σου. Δεν είναι στο cloud, δεν είναι σε sandbox. Μπορεί να διαβάζει τα αρχεία σου, να οργανώνει φακέλους, να τρέχει εντολές στο τερματικό και να χρησιμοποιεί την κάρτα γραφικών σου. Η AI γίνεται πλέον χειριστής του υπολογιστή μας, όχι απλώς ένας συνομιλητής.
-
GLM5 Turbo (Z.A.I.): Ένα μοντέλο βελτιστοποιημένο για πλήρη workflows. Με τεράστιο παράθυρο πλαισίου (context window), δεν απαντά απλώς σε ερωτήσεις, αλλά εκτελεί αλυσίδες ενεργειών. Το σημαντικό εδώ είναι η αξιοπιστία: το ποσοστό λάθους του σε κλήσεις εργαλείων είναι μόλις $0,67\%$, την ώρα που άλλα μοντέλα ξεπερνούν το $6\%$. Στην παραγωγή, η σταθερότητα κερδίζει πάντα την ταχύτητα.
Mistral και η Μαθηματική Επαλήθευση
Η γαλλική Mistral έκανε την κίνηση-ματ με το Leanstrol. Μέχρι σήμερα, η AI μπορούσε να γράψει κώδικα, αλλά συχνά έκανε λάθη (hallucinations). Το Leanstrol δεν γράφει απλώς κώδικα· τον αποδεικνύει μαθηματικά μέσω της γλώσσας Lean 4. Είναι ένας ψηφιακός ελεγκτής που μπορεί να εντοπίσει γιατί ένας κώδικας δεν λειτουργεί και να προτείνει τη μαθηματικά ορθή λύση. Για κρίσιμα συστήματα, αυτό είναι το «ιερό δισκοπότηρο».
Η μεγάλη εικόνα: Πού βαδίζουμε;
Ο Altman προβλέπει AGI (Γενική Τεχνητή Νοημοσύνη) μέσα στα επόμενα δύο χρόνια. Μιλάει για έναν κόσμο όπου ένας άνθρωπος μόνος του θα μπορεί να στήσει μια εταιρεία αξίας δισεκατομμυρίων, και όπου ένας «AI CEO» δεν είναι σενάριο επιστημονικής φαντασίας.
Το συμπέρασμα; Το τοπίο αλλάζει απότομα. Από τα chatbots περνάμε στους αυτόνομους πράκτορες και από την επεξεργασία κειμένου στην κατανόηση του τρισδιάστατου χώρου (όπως δείχνει και το Inspio World FM). Οι θέσεις εργασίας θα αλλάξουν, οι βιομηχανίες θα μετατοπιστούν, αλλά η ανάγκη του ανθρώπου να δημιουργεί και να ανταγωνίζεται παραμένει η σταθερά μας.


