Ο Μαρκ Ζούκερμπεργκ ενισχύει φέτος τις φωνητικές δυνατότητες της τεχνητής νοημοσύνης της Meta, καθώς ο γίγαντας των μέσων κοινωνικής δικτύωσης προωθεί τα σχέδια για τη δημιουργία εσόδων από την ταχέως αναπτυσσόμενη τεχνολογία.
Η Meta σχεδιάζει να εισαγάγει βελτιωμένες φωνητικές λειτουργίες στο τελευταίο μοντέλο μεγάλης γλώσσας ανοιχτού κώδικα, το Llama 4, που αναμένεται τις επόμενες εβδομάδες, δήλωσαν άνθρωποι που γνωρίζουν το θέμα, καθώς ποντάρει ότι οι μελλοντικοί λεγόμενοι πράκτορες με τεχνητή νοημοσύνη θα είναι συνομιλητικοί και όχι καθοδηγούμενοι από κείμενο.
Η εταιρεία έχει επικεντρωθεί ιδιαίτερα στο να κάνει τη συνομιλία μεταξύ ενός χρήστη και του φωνητικού της μοντέλου πιο κοντά σε έναν αμφίδρομο φυσικό διάλογο, επιτρέποντας τις διακοπές από τον χρήστη αντί για μια πιο άκαμπτη μορφή ερωτήσεων και απαντήσεων, δήλωσε ένα άτομο.
Η φωνητική ώθηση έρχεται καθώς ο Ζούκερμπεργκ, διευθύνων σύμβουλος, έχει περιγράψει τολμηρά σχέδια για να καταστήσει την εταιρεία ύψους 1,7 εκατ. δολαρίων της Silicon Valley «ηγέτη της τεχνητής νοημοσύνης», αποκαλώντας το 2025 έτος «make or break» για πολλά από τα προϊόντα τεχνητής νοημοσύνης της, καθώς ο όμιλος αγωνίζεται ενάντια σε αντιπάλους όπως η OpenAI, η Microsoft και η Google για την εμπορική αξιοποίηση της τεχνολογίας.
Αυτό έχει οδηγήσει την εταιρεία να εξετάσει το ενδεχόμενο να δοκιμάσει premium συνδρομές για τον AI βοηθό της Meta AI, για πρακτορικές εργασίες όπως κρατήσεις και δημιουργία βίντεο, δήλωσαν δύο άτομα που γνωρίζουν το θέμα. Εξετάζει επίσης το ενδεχόμενο να εισαγάγει πληρωμένη διαφήμιση ή χορηγούμενες αναρτήσεις στα αποτελέσματα αναζήτησης του βοηθού AI, δήλωσε ένας από τους ανθρώπους.
Ο Ζούκερμπεργκ αποκάλυψε φέτος σχέδια για την κατασκευή ενός μηχανικού πράκτορα AI που θα έχει τις ικανότητες κωδικοποίησης και επίλυσης προβλημάτων ενός μηχανικού μεσαίου επιπέδου, ο οποίος, όπως είπε, έχει δυνητικά μια «πολύ μεγάλη αγορά».
Η Meta αρνήθηκε να σχολιάσει.
Ο επικεφαλής προϊόντος του ομίλου Κρις Κοξ την Τετάρτη τόνισε ορισμένα από τα σχέδιά του για το Llama 4, λέγοντας ότι θα είναι ένα «παντοδύναμο μοντέλο», σύμφωνα με το οποίο η ομιλία θα είναι «εγγενής … αντί να μεταφράζεται η φωνή σε κείμενο, να στέλνεται το κείμενο στο LLM, να βγαίνει το κείμενο και να μετατρέπεται ξανά σε ομιλία».
Μιλώντας στο συνέδριο της Morgan Stanley για την τεχνολογία, τα μέσα ενημέρωσης και τις τηλεπικοινωνίες, πρόσθεσε: «Πιστεύω ότι είναι μια τεράστια συμφωνία για το προϊόν διεπαφής, η ιδέα ότι μπορείτε να μιλήσετε στο διαδίκτυο και να του ζητήσετε οτιδήποτε. Νομίζω ότι ακόμα προσπαθούμε να καταλάβουμε πόσο ισχυρό είναι αυτό».
Η Meta συζητά επίσης τις προστατευτικές μπάρες που πρέπει να έχει το νεότερο μοντέλο Llama γύρω από το τι μπορεί να παράγει και αν θα τις μειώσει, δήλωσαν δύο άτομα που γνωρίζουν το θέμα.
Οι συζητήσεις έρχονται εν μέσω ενός καταιγισμού εκτοξεύσεων από τους αντιπάλους και προειδοποιήσεων από τον νεοδιορισθέντα «τσάρο της τεχνητής νοημοσύνης» David Sacks, έναν venture capitalist της Silicon Valley, ο οποίος δήλωσε ότι θέλει να διασφαλίσει ότι τα αμερικανικά μοντέλα τεχνητής νοημοσύνης δεν είναι πολιτικά προκατειλημμένα ή «ξυπνητά».
Η OpenAI κυκλοφόρησε τη φωνητική λειτουργία της πέρυσι και έχει επικεντρωθεί στο να της δώσει ξεχωριστές προσωπικότητες, ενώ η Grok 3, που δημιουργήθηκε από την xAI του Elon Musk και είναι διαθέσιμη στην πλατφόρμα X, κυκλοφόρησε τις φωνητικές λειτουργίες της σε επιλεγμένους χρήστες στα τέλη του περασμένου μήνα.
Το μοντέλο Grok σχεδιάστηκε ειδικά για να έχει λιγότερες προστατευτικές μπάρες, συμπεριλαμβανομένης μιας «ανισόρροπης λειτουργίας» που ανταποκρίνεται σκόπιμα με τρόπους που προορίζονται να είναι «ενοχλητικοί, ακατάλληλοι και προσβλητικοί», σύμφωνα με την εταιρεία.
Η Meta παρουσίασε πέρυσι μια λιγότερο «υποκριτική» έκδοση του μοντέλου AI για την τρίτη επανάληψη του Llama, μετά από κριτική που δέχθηκε ότι το Llama 2 αρνιόταν να απαντήσει σε αθώες ερωτήσεις.
Το να επιτρέπεται στους χρήστες να αλληλεπιδρούν με έναν βοηθό AI χρησιμοποιώντας φωνητικές εντολές είναι ένα σημαντικό χαρακτηριστικό των έξυπνων γυαλιών Ray Bans της Meta, τα οποία έχουν γίνει πρόσφατα μεγάλη επιτυχία μεταξύ των καταναλωτών. Ο όμιλος έχει επιταχύνει τα σχέδιά του για την κατασκευή ελαφρών ακουστικών που μπορούν να σφετεριστούν το smartphone ως κύρια υπολογιστική συσκευή των καταναλωτών.
Hannah Murphy και Cristina Criddle, Financial Times
Επιμέλεια – Απόδοση: Τατιανή Σάγιεχ

