Dr. Earl Brandt: «Οι AI agents είναι μια καλοστημένη απάτη που καίει τα λεφτά σας»
Ο ιδρυτής της Kira AI καταρρίπτει το αφήγημα της βιομηχανίας, εξηγώντας γιατί η αντικατάσταση προσωπικού με πράκτορες τεχνητής νοημοσύνης είναι ο «πιο ερασιτεχνικός» τρόπος λειτουργίας μιας επιχείρησης
Δεν ξέρω πώς να το ωραιοποιήσω, οπότε θα το πω ευθέως: οι AI agents είναι μια απάτη. Αν ψάχνετε σε αυτούς τη λύση για να εξαλείψετε εργασίες και να μειώσετε το προσωπικό σας, προσωπικά πιστεύω ότι οδεύετε προς τη λάθος κατεύθυνση.

Και αυτό γιατί οι AI agents είναι ο λιγότερο αξιόπιστος, ο πιο ακριβός και ο πιο ερασιτεχνικός τρόπος για να διαχειριστεί κανείς έναν παραγωγικό φόρτο εργασίας που εφευρέθηκε ποτέ.
Η βιομηχανία της Τεχνητής Νοημοσύνης (AI) σας τους πουλάει ούτως ή άλλως, επειδή κάθε “πράκτορας” (agent) καίει token, και από τα token πληρώνονται.
Σε μια προσπάθεια να βάλουμε τα πράγματα στη θέση τους, πρέπει να επιστρέψουμε στις πρώτες αρχές του λογισμικού (software first principles) για να εξηγήσουμε πώς λειτουργεί πραγματικά το σοβαρό λογισμικό. Το “χρυσό πρότυπο” για τη διανομή λογισμικού είναι το μεταγλωττισμένο δυαδικό αρχείο (compiled binary).
Ο Χρυσός Κανόνας: Το Δυαδικό Αρχείο
Με απλά λόγια, αυτό σημαίνει λογισμικό που έχει μεταφραστεί απευθείας στις μηχανικές οδηγίες για ένα συγκεκριμένο τσιπ (chip). Είναι σχεδιασμένο να τρέχει σε αυτό το τσιπ και μόνο σε αυτό. Αυτό σημαίνει ότι ο επεξεργαστής εκτελεί ακριβώς αυτό που είναι γραμμένο.
Δεν υπάρχει ερμηνευτής (interpreter) στη μέση. Δεν υπάρχει χρόνος εκτέλεσης (runtime) που να μαντεύει τι εννοούσατε. Η ίδια είσοδος παράγει το ίδιο αποτέλεσμα, κάθε φορά, σε κάθε μηχάνημα με την ίδια αρχιτεκτονική.
Αυτό σημαίνει ότι μπορώ να γράψω κώδικα εδώ στο MacBook Pro μου και να ξέρω ότι σε όλους όσους έχουν ακριβώς τον ίδιο υπολογιστή, θα τρέξει ακριβώς με τον ίδιο τρόπο.
Έτσι τρέχει το λειτουργικό σας σύστημα. Έτσι τρέχει η βάση δεδομένων σας. Έτσι τρέχει το υλικολογισμικό (firmware) στο αυτοκίνητό σας. Επειδή, όταν τα διακυβεύματα είναι πραγματικά, αποστέλλουμε δυαδικά αρχεία.
Ένα δυαδικό αρχείο είναι γρήγορο επειδή είναι εγγενές (native). Είναι αξιόπιστο επειδή είναι ντετερμινιστικό (καθορισμένο). Και είναι φθηνό επειδή κάνει τη δουλειά και φεύγει. Επομένως, εάν θέλετε φόρτο εργασίας σε κλίμακα, πρέπει να χτίσετε όσο το δυνατόν πιο κοντά στο δυαδικό αρχείο.
Ο Συμβιβασμός των Container και των Interpreted Γλωσσών
Αυτό το ιδανικό δεν είναι πάντα εφικτό. Μπορεί να έχετε διαφορετικούς τύπους υλικού (hardware) και δεν έχετε την οικονομική δυνατότητα να αντικαταστήσετε τα πάντα, οπότε πρέπει να αρχίσετε να κάνετε συμβιβασμούς.
Εδώ έρχονται τα containers. Η «κοντεϊνεροποίηση» (containerization) είναι μια στρατηγική που τυλίγει τον κώδικά σας με τις εξαρτήσεις του και τον τρέχει σε ένα απομονωμένο περιβάλλον. Εξακολουθεί να είναι μεταγλωττισμένος κώδικας στις περισσότερες περιπτώσεις. Εξακολουθεί να είναι ντετερμινιστικός, οπότε ξέρετε τι θα πάρετε στην άλλη πλευρά.
Αλλά τώρα αρχίζετε να πληρώνετε έναν μικρό «φόρο» όσον αφορά την απόδοση και την πολυπλοκότητα, ώστε να μπορείτε να τον μετακινήσετε σε παρόμοια μηχανήματα. Τεχνολογίες όπως το Docker και το Kubernetes, όλη αυτή η υποδομή, υπάρχουν επειδή αποδεχόμαστε λίγη επιπλέον επιβάρυνση (overhead) με αντάλλαγμα τη δυνατότητα να μετακινούμε πράγματα.
Το πρόβλημα με τα containers είναι ότι έχουν «κρύα εκκίνηση» (cold start)· δεν ξεκινούν αμέσως. Επιπλέον, καταναλώνουν μνήμη τα ίδια, και κάθε οδηγία πρέπει να περάσει από ένα στρώμα ενορχήστρωσης (orchestration layer). Αλλά η ίδια η δουλειά εξακολουθεί να γίνεται σε εγγενή κώδικα και η συμπεριφορά είναι ακόμα προβλέψιμη. Είναι αποδεκτή μηχανική και το μεγαλύτερο μέρος του σύγχρονου cloud τρέχει με αυτόν τον τρόπο.
Αν κάνετε ένα βήμα πίσω, εδώ έρχονται οι ερμηνευόμενες γλώσσες (interpreted languages) και τα scripts. Πράγματα όπως η Python, η JavaScript, η Ruby. Ο κώδικας δεν μεταγλωττίζεται σε οδηγίες μηχανής εκ των προτέρων. Αντίθετα, ένας ερμηνευτής (interpreter) διαβάζει τον πηγαίο κώδικα κατά τον χρόνο εκτέλεσης και αποφασίζει τι θα κάνει με κάθε γραμμή.
Εδώ αρχίζετε να πληρώνετε έναν σοβαρό φόρο απόδοσης. Η Python μπορεί να είναι 100 φορές πιο αργή από τη C για τους περισσότερους φόρτους εργασίας. Αυτό σημαίνει ότι το μεγαλύτερο μέρος της επεξεργαστικής σας ισχύος δαπανάται στην ερμηνεία και τη μετάφραση του κώδικά σας, όχι στην εκτέλεση της πραγματικής λογικής. Κάθε μεταβλητή θα περάσει από ένα λεξικό για να ελέγξει τον τύπο της, και με αυτόν τον τρόπο είναι πολύ εύκολο να εισαχθούν σφάλματα (bugs) και αποτυχίες στην πορεία, επειδή κυριολεκτικά επινοεί τις οδηγίες καθώς προχωρά.
Το καλό είναι ότι οι ερμηνευόμενες γλώσσες είναι ακόμα ντετερμινιστικές. Τους δίνετε την ίδια είσοδο και παίρνετε το ίδιο αποτέλεσμα. Αλλά πληρώνετε 100 φορές περισσότερα για την ίδια δουλειά σε σύγκριση με το “χρυσό πρότυπο”. Το ανεχόμαστε αυτό επειδή οι προγραμματιστές είναι ακριβοί και η Python γράφεται γρήγορα.
Ο Πάτος της Αξιοπιστίας: AI Agents
Και μετά, στον πάτο της σκάλας αξιοπιστίας, έχουμε τους AI agents.
Ο AI agent είναι η χειρότερη από όλες αυτές τις επιλογές. Και το γεγονός ότι η βιομηχανία AI τους προωθεί τόσο έντονα έρχεται σε αντίθεση με κάθε θεμελιώδη αρχή σχεδιασμού (fundamental design principle) προς την οποία εργάζεται η βιομηχανία τεχνολογίας εδώ και χρόνια.
Όταν ζητάτε από έναν «πράκτορα» να κάνει κάτι, δεν εκτελεί οδηγίες. Ζητά από ένα Μεγάλο Γλωσσικό Μοντέλο (LLM) να ερμηνεύσει τη μορφοποίηση (markdown) για να γράψει κάποιο κώδικα, τον οποίο στη συνέχεια θα εκτελέσει.
Και επειδή τα LLMs είναι εγγενώς πιθανοτικά (probabilistic), το ίδιο prompt θα παράγει διαφορετικά αποτελέσματα σε διαφορετικές εκτελέσεις. Αυτό σημαίνει ότι η ίδια εργασία θα μπορούσε να πάρει διαφορετικό αριθμό βημάτων. Η ροή εργασίας που λειτούργησε χθες, μπορεί να μην λειτουργήσει αύριο, και δεν θα έχετε ποτέ ιδέα γιατί.
Αυτή δεν είναι μια σοβαρή προγραμματιστική τεχνική. Είναι το «θεώρημα της άπειρης μαϊμούς» (infinite monkey theorem) ντυμένο ως λογισμικό. Αν χτυπήσετε αρκετά πλήκτρα και κάψετε αρκετά token, τελικά μπορεί να πάρετε τα άπαντα του Σαίξπηρ.
Ειλικρινά, κουνάω το κεφάλι μου όταν ακούω ανθρώπους να μιλούν για agents.
Η Τρομακτική Σύγκριση Κόστους και Απόδοσης
Ας δούμε τους αριθμούς. Ένα εγγενές δυαδικό αρχείο (native binary) εκτελεί μια εργασία σε χιλιοστά του δευτερολέπτου (milliseconds) για ένα κλάσμα του σεντ ηλεκτρικής ενέργειας. Ένα ερμηνευόμενο σενάριο Python μπορεί να τρέξει την ίδια εργασία σε δεκάδες χιλιοστά του δευτερολέπτου για ένα ελαφρώς μεγαλύτερο κλάσμα του σεντ. Μια κοντεϊνεροποιημένη (containerized) μικροϋπηρεσία μπορεί να προσθέσει λίγο περισσότερο χρόνο επιβάρυνσης (overhead) πάνω από αυτό.
Αλλά ένας AI agent που κάνει την ίδια εργασία μπορεί να κάψει χιλιάδες token, να πάρει 10 έως 30 δευτερόλεπτα και να σας κοστίσει 1 έως 50 σεντ ανά εκτέλεση.
Και μπορεί να είναι λάθος! Και δεν έχετε κανέναν τρόπο να γνωρίζετε εκ των προτέρων εάν αυτή η εκτέλεση θα πετύχει ή θα αποτύχει.
Πληρώνετε 1.000 φορές περισσότερη υπολογιστική ισχύ για 1.000 φορές λιγότερη αξιοπιστία. Και αυτό είναι απάτη.
Κάθε στρώμα αφαίρεσης (abstraction layer) που προσθέτουν οι πωλητές AI μεταξύ της επιχειρηματικής σας λογικής και του πυριτίου (silicon), είναι ένα στρώμα για να σας χρεώνουν χρήματα.
Οι AI agents είναι η πιο κερδοφόρα αφαίρεση που εφευρέθηκε ποτέ, επειδή καταναλώνουν token ανάλογα με το πόσο αποτυγχάνουν. Αυτό σημαίνει ότι όσο χειρότερα αποδίδουν, τόσο περισσότερα πληρώνετε.
Συμπέρασμα: Μακριά από το «Θέατρο AI»
Ενώ η υπόλοιπη βιομηχανία χτίζει όλο και μεγαλύτερα μοντέλα, εγώ χτίζω όλο και μικρότερα. Η Kira AI που χτίζω είναι όσο το δυνατόν πιο κοντά στο δυαδικό αρχείο, ώστε να παραμένει γρήγορη, φθηνή και, το σημαντικότερο, να παραμένει ασφαλής.
Επομένως, η συμβουλή μου είναι: χρησιμοποιήστε τους AI agents για να μάθετε και να δημιουργήσετε πρωτότυπα (prototypes). Είναι πολύ διασκεδαστικοί για προσωπικά projects στο σπίτι και για τη διαμόρφωση επιχειρηματικής λογικής.
Αλλά όταν μιλάτε σοβαρά, πρέπει να χτίζετε όσο το δυνατόν πιο κοντά στο δυαδικό αρχείο. Όσο πιο μακριά απομακρύνεστε από αυτό, τόσο περισσότερο πληρώνετε για το περιθώριο κέρδους κάποιου άλλου. Αυτή είναι η πειθαρχία. Επειδή όλα τα άλλα είναι απλώς θέατρο AI.
