Γιατί το Chatgpt είναι προγραμματισμένο να λέει ψέματα και πώς την «πάτησαν» κυβερνήσεις, κολοσσοί και media

Από τις ανύπαρκτες πηγές σε κρατικές εκθέσεις μέχρι το φιάσκο της Air Canada και του Sports Illustrated, το πρόβλημα των «παραισθήσεων» του AI δεν είναι τυχαίο. Οφείλεται στον ίδιο τον τρόπο με τον οποίο κατασκευάστηκε

Γιατί το Chatgpt είναι προγραμματισμένο να λέει ψέματα και πώς την «πάτησαν» κυβερνήσεις, κολοσσοί και media

Ο ίδιος ο Sam Altman προειδοποιεί τον κόσμο να σταματήσει να εμπιστεύεται τυφλά το ChatGPT. Το ερώτημα, όμως, δεν είναι μόνο αν το εργαλείο λέει ψέματα, αλλά γιατί το κάνει. Η απάντηση κρύβεται στην καρδιά της αρχιτεκτονικής του και σε μια διαδικασία που ονομάζεται «ενισχυτική μάθηση» (reinforcement learning).

σχετικά άρθρα

Όσο περίπλοκος κι αν ακούγεται ο όρος, η λογική του είναι εξαιρετικά απλή. Ας φανταστούμε έναν μαθητή σε μια σχολική τάξη. Κάθε φορά που δίνει τη σωστή απάντηση, επιβραβεύεται με έναν πόντο. Κάθε φορά που απαντά «δεν ξέρω», παίρνει μηδέν. Αν όμως μαντέψει, υπάρχει πιθανότητα να πετύχει τη σωστή απάντηση και να πάρει τον πόντο. Το αποτέλεσμα; Ο μαθητής μαθαίνει να μην παραδέχεται ποτέ την άγνοιά του. Μαθαίνει να μαντεύει και, τελικά, να επινοεί πράγματα.

Η OpenAI, δοκιμάζοντας τα μοντέλα της σε 10 κορυφαία τεστ αξιολόγησης, διαπίστωσε το εξής: στις 9 από τις 10 περιπτώσεις, η λανθασμένη απάντηση και το «δεν ξέρω» βαθμολογούνταν ακριβώς το ίδιο — με μηδέν. Έτσι, η τεχνητή νοημοσύνη εκπαιδεύτηκε να λέει ψέματα. Και μάλιστα, να το κάνει με απόλυτη αυτοπεποίθηση. Κάθε φορά.

Η θεωρία των «Στοχαστικών Παπαγάλων»

Αυτή η μηχανική συμπεριφορά δεν αποτελεί έκπληξη για τους ειδικούς. Πίσω στο 2021, αρκετά πριν την παγκόσμια φρενίτιδα του ChatGPT, τέσσερις κορυφαίες ερευνήτριες (μεταξύ των οποίων η Timnit Gebru και η Emily M. Bender) δημοσίευσαν μια ιστορική έρευνα με τίτλο «On the Dangers of Stochastic Parrots» (Για τους κινδύνους των στοχαστικών παπαγάλων).

Ο όρος αυτός συνοψίζει τέλεια τη φύση των Μεγάλων Γλωσσικών Μοντέλων (LLMs). Δεν πρόκειται για οντότητες με συνείδηση, αλλά για τεράστιες στατιστικές μηχανές που απλώς υπολογίζουν ποια λέξη είναι μαθηματικά πιο πιθανό να ακολουθήσει την προηγούμενη. Το ChatGPT δεν έχει ιδέα τι σημαίνουν αυτά που γράφει, δεν έχει μηχανισμούς ελέγχου της αλήθειας και στερείται οποιασδήποτε οντολογικής σύνδεσης με τον πραγματικό κόσμο. Το μόνο που κάνει είναι να «παπαγαλίζει» στατιστικά μοτίβα που συνέλεξε από το ίντερνετ, πλέκοντας εντυπωσιακά πειστικές, αλλά συχνά εντελώς φανταστικές αφηγήσεις.

Η «ρώσικη ρουλέτα» των δεδομένων

Το πρόβλημα των παραισθήσεων δεν είναι μια σπάνια δυσλειτουργία, αλλά ένα δομικό ελάττωμα που πλέον μετριέται με ακρίβεια. Η εταιρεία Vectara διατηρεί έναν διαρκώς ανανεούμενο δείκτη (Vectara Hallucination Leaderboard) που αξιολογεί τα κορυφαία μοντέλα της αγοράς στη σύνθεση κειμένων.

Τα στοιχεία είναι αποκαλυπτικά: ακόμα και τα πιο εξελιγμένα συστήματα πίσω από το ChatGPT ή το Google Gemini αδυνατούν να μηδενίσουν τα σφάλματα, παρουσιάζοντας ένα σταθερό ποσοστό παραισθήσεων που κυμαίνεται από 2% έως 5%, ακόμα και σε απλές εργασίες περίληψης εγγράφων. Όταν τα δεδομένα γίνονται πιο πολύπλοκα, το ποσοστό αυθόρμητου λάθους εκτοξεύεται. Με απλά λόγια, η τυφλή χρήση του AI για τη σύνταξη σοβαρών κειμένων θυμίζει ρώσικη ρουλέτα.

Νομικά φιάσκα και κυβερνητικές γκάφες

Η κατάσταση ξεφεύγει από τη σφαίρα της θεωρίας όταν αυτά τα εργαλεία χρησιμοποιούνται σε κρίσιμους τομείς χωρίς κανέναν έλεγχο. Οι παραισθήσεις του AI έχουν ήδη οδηγήσει σε πρωτοφανείς περιπέτειες:

  • Η απάτη των πηγών στα δικαστήρια: Ένας δικηγόρος στην Καλιφόρνια τιμωρήθηκε πρόσφατα με αυστηρό πρόστιμο 10.000 δολαρίων, επειδή κατέθεσε έφεση η οποία περιείχε 21 νομικές παραπομπές που είχε κατασκευάσει εξ ολοκλήρου το ChatGPT.
  • Το άλλοθι της Air Canada: Στην πολυσυζητημένη υπόθεση Moffatt v. Air Canada, το επίσημο chatbot της αεροπορικής εταιρείας διαβεβαίωσε ψευδώς έναν επιβάτη ότι μπορούσε να υποβάλει αναδρομικό αίτημα για έκπτωση πένθους εντός 90 ημερών. Όταν η Air Canada αρνήθηκε την αποζημίωση, έφτασε στο σημείο να υποστηρίξει στο δικαστήριο ότι το αυτόνομο λογισμικό αποτελεί «ξεχωριστή νομική οντότητα»! Το δικαστήριο απέρριψε κατηγορηματικά το επιχείρημα, καταδικάζοντας την εταιρεία για αμελή παραπλάνηση.
  • Η περίπτωση της Deloitte: Μία από τις μεγαλύτερες συμβουλευτικές εταιρείες στον κόσμο έλαβε 290.000 δολάρια για μια κυβερνητική έκθεση, η οποία αποδείχθηκε γεμάτη από ανύπαρκτες βιβλιογραφικές αναφορές, αναγκάζοντας την εταιρεία να παραδεχτεί τη χρήση AI.
  • Πολιτικές υγείας στον αέρα: Η κυβέρνηση των ΗΠΑ διαμόρφωσε μια ομοσπονδιακή πολιτική για την παιδική υγεία βασισμένη σε μια έκθεση με 19 παραπομπές. Όλες ήταν κατασκευασμένες από AI και κανείς δεν μπήκε στον κόπο να τις ελέγξει.

Η επέλαση των φαντασμάτων στη δημοσιογραφία

Η αλόγιστη χρήση του AI έχει αρχίσει να διαβρώνει και τον πυρήνα της παραδοσιακής δημοσιογραφίας. Το πιο ηχηρό ίσως παράδειγμα είναι το σκάνδαλο που χτύπησε το ιστορικό αμερικανικό περιοδικό Sports Illustrated. Το μέσο πιάστηκε να δημοσιεύει δεκάδες άρθρα τα οποία υπέγραφαν ανύπαρκτοι συντάκτες, με ψεύτικα βιογραφικά και φωτογραφίες αγορασμένες από ιστοσελίδες παραγωγής τεχνητών προσώπων.

Όταν ξέσπασε ο σάλος, η εκδότρια εταιρεία (The Arena Group) διέγραψε βιαστικά το περιεχόμενο, επιχειρώντας να μεταθέσει την ευθύνη στην AdVon Commerce, μια εξωτερική εταιρεία παραγωγής περιεχομένου. Η δικαιολογία της AdVon ότι τα κείμενα γράφονταν από ανθρώπους υπό ψευδώνυμα κατέρρευσε γρήγορα, αναδεικνύοντας τους τεράστιους κινδύνους που κρύβει η φτηνή, αυτοματοποιημένη παραγωγή για το κύρος των εκδοτικών συγκροτημάτων. Αντίστοιχη ήταν και η περίπτωση της Victoria Goldie, μιας φανταστικής δημοσιογράφου “δημιουργημένης” από AI, της οποίας τα ανύπαρκτα άρθρα φιλοξενήθηκαν θεωρητικά σε μέσα όπως ο Guardian και το The Cut.

Το λάθος εργαλείο για τη λάθος δουλειά

Το πραγματικό πρόβλημα δεν είναι η ίδια η τεχνητή νοημοσύνη, αλλά η προσδοκία μας από αυτήν. Το ChatGPT κατασκευάστηκε για να προβλέπει τη γλώσσα και να συνθέτει κείμενο που ρέει φυσικά. Όχι για να επαληθεύει γεγονότα.

Όταν η ακρίβεια είναι αδιαπραγμάτευτη —όπως στην περίπτωση φοιτητών, ερευνητών ή ακαδημαϊκών που συγγράφουν δοκίμια και διατριβές— η χρήση ενός απλού LLM είναι συνταγή αποτυχίας. Για τέτοιες ανάγκες, υπάρχουν εξειδικευμένα εργαλεία, όπως το PaperPal, τα οποία αντλούν δεδομένα από εκατομμύρια πραγματικές, δημοσιευμένες εργασίες. Εκεί, κάθε παραπομπή οδηγεί σε επαληθευμένη πηγή. Τέτοιες πλατφόρμες ενσωματώνουν ελέγχους για ανίχνευση AI, προσαρμόζουν το κείμενο στο αυστηρό ακαδημαϊκό ύφος και λειτουργούν ως πραγματικοί βοηθοί έρευνας — όχι ως «στοχαστικοί παπαγάλοι».

Πριν, λοιπόν, εμπιστευτείτε την επόμενη πειστική απάντηση ενός γλωσσικού μοντέλου, θυμηθείτε: είναι προγραμματισμένο να ακούγεται σωστό. Όχι να είναι σωστό.