Η τεχνητή νοημοσύνη μπορεί να μάθει να σκέφτεται πριν μιλήσει

Η πρόοδος στη συλλογιστική θα οδηγήσει σε σημαντικά βελτιωμένες ικανότητες στα μαθηματικά και τις επιστήμες

Yoshua Bengio, Financial Times

Ο συγγραφέας είναι καθηγητής πληροφορικής στο Πανεπιστήμιο του Μόντρεαλ και ιδρυτής του Ινστιτούτου Τεχνητής Νοημοσύνης του Κεμπέκ Mila

Η έλλειψη ικανοτήτων εσωτερικής σκέψης – σκέψης, με άλλα λόγια – θεωρείται εδώ και καιρό μια από τις κύριες αδυναμίες της τεχνητής νοημοσύνης. Η κλίμακα μιας πρόσφατης προόδου σε αυτό από τον δημιουργό του ChatGPT OpenAI αποτελεί σημείο συζήτησης στην επιστημονική κοινότητα.

Αλλά οδηγεί πολλούς από τους ειδικούς συναδέλφους μου και εμένα να πιστεύουμε ότι υπάρχει πιθανότητα να βρισκόμαστε στα πρόθυρα της γεφύρωσης του χάσματος προς τη λογική ανθρώπινου επιπέδου. Οι ερευνητές υποστηρίζουν εδώ και καιρό ότι τα παραδοσιακά νευρωνικά δίκτυα -η κορυφαία προσέγγιση στην ΤΝ- ευθυγραμμίζονται περισσότερο με τη νόηση του «συστήματος 1». Αυτό αντιστοιχεί σε άμεσες ή διαισθητικές απαντήσεις σε ερωτήσεις (όπως όταν αναγνωρίζεται αυτόματα ένα πρόσωπο).

Η ανθρώπινη νοημοσύνη, από την άλλη πλευρά, βασίζεται επίσης στη νόηση του «συστήματος 2». Αυτό περιλαμβάνει εσωτερική σκέψη και επιτρέπει ισχυρές μορφές συλλογισμού (όπως όταν λύνεται ένα μαθηματικό πρόβλημα ή όταν σχεδιάζεται κάτι λεπτομερώς). Μας επιτρέπει να συνδυάζουμε κομμάτια γνώσης με συνεκτικούς αλλά και νέους τρόπους. Η πρόοδος της OpenAI, η οποία δεν έχει ακόμη δοθεί πλήρως στο κοινό, βασίζεται σε μια μορφή τεχνητής νοημοσύνης με εσωτερική διαβούλευση που γίνεται με το μεγάλο γλωσσικό μοντέλο o1 (LLM).

Η καλύτερη συλλογιστική θα μπορούσε να αντιμετωπίσει δύο σημαντικές αδυναμίες της σημερινής ΤΝ: την κακή συνοχή των απαντήσεων και την ικανότητα σχεδιασμού και επίτευξης μακροπρόθεσμων στόχων. Το πρώτο είναι σημαντικό σε επιστημονικές χρήσεις και το δεύτερο είναι απαραίτητο για τη δημιουργία αυτόνομων πρακτόρων. Και τα δύο θα μπορούσαν να επιτρέψουν σημαντικές εφαρμογές. Οι αρχές πίσω από τη συλλογιστική ήταν στο επίκεντρο της έρευνας της ΤΝ τον 20ό αιώνα.

Ένα πρώιμο παράδειγμα επιτυχίας ήταν το AlphaGo της DeepMind, το πρώτο υπολογιστικό σύστημα που νίκησε τους ανθρώπινους πρωταθλητές στο αρχαίο ασιατικό παιχνίδι Go το 2015, και πιο πρόσφατα το AlphaProof, το οποίο ασχολείται με μαθηματικά θέματα. Εδώ, τα νευρωνικά δίκτυα μαθαίνουν να προβλέπουν τη χρησιμότητα μιας ενέργειας. Τέτοιες «διαισθήσεις» χρησιμοποιούνται στη συνέχεια για τον προγραμματισμό, αναζητώντας αποτελεσματικά πιθανές ακολουθίες ενεργειών. Ωστόσο, το AlphaGo και το AlphaProof περιλαμβάνουν πολύ εξειδικευμένες γνώσεις (για το παιχνίδι Go και για συγκεκριμένους μαθηματικούς τομείς αντίστοιχα). Αυτό που παραμένει ασαφές είναι πώς να συνδυαστεί το εύρος των γνώσεων των σύγχρονων LLM με ισχυρές ικανότητες συλλογισμού και σχεδιασμού.

Έχουν σημειωθεί κάποιες εξελίξεις. Ήδη, οι LLM δίνουν καλύτερες απαντήσεις σε πολύπλοκες ερωτήσεις όταν τους ζητείται να δημιουργήσουν μια αλυσίδα σκέψης που οδηγεί στην απάντησή τους. Η νέα σειρά «o» του OpenAI προωθεί αυτή την ιδέα περαιτέρω, και απαιτεί πολύ περισσότερους υπολογιστικούς πόρους, και συνεπώς ενέργεια, για να το κάνει. Με μια πολύ μεγάλη αλυσίδα σκέψης εκπαιδεύεται να «σκέφτεται» καλύτερα. Βλέπουμε έτσι να εμφανίζεται μια νέα μορφή υπολογιστικής κλιμάκωσης. Όχι απλώς περισσότερα δεδομένα εκπαίδευσης και μεγαλύτερα μοντέλα, αλλά περισσότερος χρόνος που δαπανάται για να «σκεφτεί» τις απαντήσεις.

Αυτό οδηγεί σε σημαντικά βελτιωμένες ικανότητες σε εργασίες με βαρύ συλλογισμό, όπως τα μαθηματικά, η επιστήμη των υπολογιστών και η επιστήμη ευρύτερα. Για παράδειγμα, ενώ το προηγούμενο μοντέλο GPT-4o του OpenAI σημείωσε μόνο περίπου 13% στην Μαθηματική Ολυμπιάδα των Ηνωμένων Πολιτειών του 2024 (στο τεστ AIME), το o1 έφτασε το 83%, τοποθετώντας το ανάμεσα στους 500 καλύτερους μαθητές της χώρας. Σε περίπτωση επιτυχίας, υπάρχουν σημαντικοί κίνδυνοι που πρέπει να ληφθούν υπόψη. Δεν γνωρίζουμε ακόμη πώς να ευθυγραμμίσουμε και να ελέγξουμε αξιόπιστα την ΤΝ.

Για παράδειγμα, η αξιολόγηση του o1 έδειξε αυξημένη ικανότητα εξαπάτησης των ανθρώπων – φυσική συνέπεια της βελτίωσης των δεξιοτήτων επίτευξης στόχων. Είναι επίσης ανησυχητικό το γεγονός ότι η ικανότητα του o1 να συμβάλλει στη δημιουργία βιολογικών όπλων ξεπέρασε το όριο κινδύνου του ίδιου του OpenAI από χαμηλό σε μέτριο. Αυτό είναι το υψηλότερο αποδεκτό επίπεδο σύμφωνα με την εταιρεία (η οποία μπορεί να έχει συμφέρον να διατηρεί τις ανησυχίες σε χαμηλά επίπεδα).

Το ξεκλείδωμα της λογικής και της πράξης πιστεύεται ότι είναι τα κύρια ορόσημα στην πορεία προς την τεχνητή νοημοσύνη ανθρώπινου επιπέδου, γνωστή και ως τεχνητή γενική νοημοσύνη. Συνεπώς, υπάρχουν ισχυρά οικονομικά κίνητρα για τις μεγάλες εταιρείες που τρέχουν προς αυτόν τον στόχο να κάνουν περικοπές στην ασφάλεια. o1 είναι πιθανό να είναι μόνο ένα πρώτο βήμα. Παρόλο που τα καταφέρνει καλά σε πολλές εργασίες συλλογισμού και μαθηματικών, φαίνεται ότι ο μακροπρόθεσμος σχεδιασμός δεν έχει ακόμη επιτευχθεί. Το o1 αγωνίζεται σε πιο σύνθετες εργασίες σχεδιασμού, γεγονός που υποδηλώνει ότι πρέπει να γίνει ακόμη δουλειά για να επιτευχθεί το είδος της αυτόνομης πράξης που επιδιώκουν οι εταιρείες τεχνητής νοημοσύνης.

Αλλά με βελτιωμένες προγραμματιστικές και επιστημονικές ικανότητες, αναμένεται ότι αυτά τα νέα μοντέλα θα μπορούσαν να επιταχύνουν την έρευνα για την ίδια την τεχνητή νοημοσύνη. Αυτό θα μπορούσε να την οδηγήσει σε νοημοσύνη ανθρώπινου επιπέδου γρηγορότερα από ό,τι αναμενόταν. Η πρόοδος στις ικανότητες συλλογισμού καθιστά ακόμη πιο επείγουσα τη ρύθμιση των μοντέλων ΤΝ προκειμένου να προστατευθεί το κοινό.

Τ.Σ.

Ακολουθήστε το στο Google News και μάθετε πρώτοι όλες τις ειδήσεις
Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, στο