Γιατί η «απόσταξη» έχει γίνει η πιο τρομακτική λέξη για τις εταιρείες AI

H επιτυχία της DeepSeek να μαθαίνει από μεγαλύτερα μοντέλα AI εγείρει ερωτήματα σχετικά με τα δισεκατομμύρια που δαπανώνται για την πιο προηγμένη τεχνολογία

Οι τεχνολογικοί κολοσσοί έχουν δαπανήσει δισεκατομμύρια δολάρια με την παραδοχή ότι το μεγαλύτερο είναι καλύτερο στην τεχνητή νοημοσύνη. Το επίτευγμα της DeepSeek δείχνει ότι το μικρότερο μπορεί να είναι εξίσου καλό.

Το άλμα της κινεζικής εταιρείας στην κορυφή των κατασκευαστών τεχνητής νοημοσύνης προκάλεσε έντονες συζητήσεις στη Silicon Valley γύρω από μια διαδικασία που χρησιμοποίησε η DeepSeek, γνωστή ως απόσταξη, κατά την οποία ένα νέο σύστημα μαθαίνει από ένα υπάρχον, θέτοντάς του εκατοντάδες χιλιάδες ερωτήσεις και αναλύοντας τις απαντήσεις.

«Είναι κάπως σαν να έχετε δύο ώρες για να πάρετε συνέντευξη από τον Αϊνστάιν και να βγαίνετε από εκεί σχεδόν εξίσου ενημερωμένοι με αυτόν στη φυσική», δήλωσε ο Ali Ghodsi, διευθύνων σύμβουλος της εταιρείας διαχείρισης δεδομένων Databricks.

Οι κορυφαίες τεχνητές νοημοσύνες από εταιρείες όπως η OpenAI και η Anthropic ουσιαστικά διδάσκονται από την αρχή με τεράστιες ποσότητες ακατέργαστων δεδομένων – μια διαδικασία που συνήθως απαιτεί πολλούς μήνες και δεκάδες εκατομμύρια δολάρια ή και περισσότερα. Αξιοποιώντας τα αποτελέσματα αυτής της εργασίας, η απόσταξη μπορεί να δημιουργήσει ένα μοντέλο που είναι σχεδόν εξίσου καλό μέσα σε λίγες εβδομάδες ή και ημέρες, με σημαντικά λιγότερα χρήματα.

Η OpenAI δήλωσε την Τετάρτη ότι έχει δει ενδείξεις ότι η DeepSeek έχει αποστάξει από τα μοντέλα AI που τροφοδοτούν το ChatGPT για την κατασκευή των συστημάτων της. Οι όροι παροχής υπηρεσιών της OpenAI απαγορεύουν τη χρήση της τεχνητής νοημοσύνης της για την ανάπτυξη ανταγωνιστικών προϊόντων.

Η DeepSeek δεν απάντησε σε μηνύματα ηλεκτρονικού ταχυδρομείου που ζητούσαν σχόλια.

Η απόσταξη δεν είναι μια νέα ιδέα, αλλά η επιτυχία της DeepSeek με αυτήν εγείρει νέες αμφιβολίες σχετικά με τα επιχειρηματικά μοντέλα των τεχνολογικών κολοσσών και των νεοφυών επιχειρήσεων που δαπανούν δισεκατομμύρια για την ανάπτυξη της πιο προηγμένης AI, συμπεριλαμβανομένης της Google, της OpenAI, της Anthropic και της xAI του Elon Musk. Μόλις την περασμένη εβδομάδα, η OpenAI ανακοίνωσε μια συνεργασία με τη SoftBank και άλλους για την επένδυση 500 δισεκατομμυρίων δολαρίων σε υποδομές τεχνητής νοημοσύνης τα επόμενα πέντε χρόνια.

Εάν αυτές οι επενδύσεις δεν παρέχουν στις εταιρείες ένα ασυναγώνιστο πλεονέκτημα, αλλά αντίθετα χρησιμεύουν ως εφαλτήριο για φθηνότερους αντιπάλους, ενδέχεται να είναι δύσκολο να δικαιολογηθούν. Στον απόηχο της DeepSeek, τα στελέχη και οι επενδυτές στη Silicon Valley επανεξετάζουν τα επιχειρηματικά τους μοντέλα και διερωτώνται αν αξίζει ακόμη να είσαι ηγέτης του κλάδου.

«Είναι οικονομικά αποδοτικό να είσαι στην αιχμή του δόρατος αν κοστίζει οκτώ φορές περισσότερο από τον γρήγορο οπαδό;» δήλωσε ο Mike Volpi, βετεράνος στέλεχος τεχνολογίας και επενδυτής επιχειρηματικών κεφαλαίων που είναι γενικός εταίρος της Hanabi Capital.

Ο διευθύνων σύμβουλος της OpenAI Sam Altman στο X αποκάλεσε την τελευταία έκδοση της DeepSeek «ένα εντυπωσιακό μοντέλο, ιδιαίτερα γύρω από το τι είναι σε θέση να προσφέρει για την τιμή» και πρόσθεσε: «Είμαστε ενθουσιασμένοι που θα συνεχίσουμε να εκτελούμε τον οδικό χάρτη της έρευνάς μας». Ο διευθύνων σύμβουλος της Anthropic, Dario Amodei, έγραψε στο ιστολόγιό του ότι το μοντέλο-ναυαρχίδα της DeepSeek «δεν είναι μια μοναδική ανακάλυψη ή κάτι που αλλάζει ριζικά τα οικονομικά» των προηγμένων συστημάτων τεχνητής νοημοσύνης, αλλά μάλλον «ένα αναμενόμενο σημείο σε μια συνεχή καμπύλη μείωσης του κόστους».

Τα στελέχη της τεχνολογίας αναμένουν να δουν σύντομα περισσότερες εφαρμογές AI υψηλής ποιότητας που θα γίνουν με απόσταξη. Οι ερευνητές της εταιρείας AI Hugging Face άρχισαν να προσπαθούν να δημιουργήσουν ένα μοντέλο παρόμοιο με αυτό της DeepSeek την περασμένη εβδομάδα. «Το ευκολότερο πράγμα που μπορεί να αναπαραχθεί είναι η διαδικασία απόσταξης», δήλωσε ο ανώτερος ερευνητής Lewis Tunstall.

Τα μοντέλα τεχνητής νοημοσύνης της OpenAI και της Google παραμένουν μπροστά από την DeepSeek στις πιο ευρέως χρησιμοποιούμενες κατατάξεις στη Silicon Valley. Οι τεχνολογικοί γίγαντες είναι πιθανό να διατηρούν προβάδισμα στα πιο προηγμένα συστήματα, επειδή κάνουν την πιο πρωτότυπη έρευνα. Αλλά πολλοί καταναλωτές και επιχειρήσεις είναι ευτυχείς να χρησιμοποιούν τεχνολογία που είναι λίγο χειρότερη αλλά κοστίζει πολύ λιγότερο.

Ο τσάρος του προέδρου Τραμπ για την Τεχνητή Νοημοσύνη, Ντέιβιντ Σακς, δήλωσε στο Fox News την Τρίτη ότι αναμένει από τις αμερικανικές εταιρείες να καταστήσουν δυσκολότερη τη χρήση των μοντέλων τους για απόσταξη.

Η DeepSeek δήλωσε ότι χρησιμοποίησε την απόσταξη σε AI ανοιχτού κώδικα που κυκλοφόρησαν οι Meta Platforms και Alibaba στο παρελθόν, καθώς και από ένα από τα μοντέλα της για να κατασκευάσει ένα άλλο. Οι προγραμματιστές AI ανοικτού κώδικα συνήθως επιτρέπουν την απόσταξη, εάν τους δοθεί πίστωση. Τα μοντέλα της DeepSeek είναι ανοικτού κώδικα.

Η NovaSky, ένα ερευνητικό εργαστήριο στο Πανεπιστήμιο της Καλιφόρνιας στο Μπέρκλεϊ, κυκλοφόρησε αυτό το μήνα τεχνολογία που, όπως είπε, ήταν εφάμιλλη ενός πρόσφατου μοντέλου που κυκλοφόρησε από το OpenAI. Οι επιστήμονες της NovaSky το κατασκεύασαν για 450 δολάρια αποστάζοντας ένα μοντέλο ανοιχτού κώδικα από την κινεζική εταιρεία Alibaba.

Οι ερευνητές του Μπέρκλεϊ κυκλοφόρησαν το μοντέλο ως λογισμικό ανοικτού κώδικα και ήδη χρησιμοποιείται για να βοηθήσει στην κατασκευή πιο φθηνής τεχνολογίας τεχνητής νοημοσύνης. Μια νεοσύστατη εταιρεία, η Bespoke Labs, το χρησιμοποίησε για να αποστάξει την τεχνολογία της DeepSeek σε ένα νέο μοντέλο που, όπως είπε, είχε καλές επιδόσεις σε προβλήματα κωδικοποίησης και μαθηματικών.

«Η απόσταξη ως τεχνική είναι πολύ αποτελεσματική για την προσθήκη νέων δυνατοτήτων σε ένα υπάρχον μοντέλο», δήλωσε ο Ion Stoica, καθηγητής πληροφορικής στο UC Berkeley.

Ο ανταγωνισμός στον κλάδο της τεχνητής νοημοσύνης είναι ήδη σκληρός και οι περισσότερες εταιρείες χάνουν χρήματα καθώς μάχονται για μερίδιο αγοράς. Η είσοδος της DeepSeek και άλλων που χρησιμοποιούν την απόσταξη θα μπορούσε να οδηγήσει τις τιμές σε περαιτέρω πτώση, δημιουργώντας έναν βρόχο ανατροφοδότησης στον οποίο είναι όλο και πιο δύσκολο να δικαιολογηθεί η δαπάνη τεράστιων ποσών για προηγμένη έρευνα.

Οι τιμές για τους προγραμματιστές λογισμικού που έχουν πρόσβαση σε μοντέλα τεχνητής νοημοσύνης από το OpenAI και άλλους έχουν μειωθεί δραματικά τον τελευταίο χρόνο. Η AI ανοικτού κώδικα, όπως αυτή της DeepSeek, υπόσχεται μόνο περαιτέρω μείωση του κόστους, σύμφωνα με στελέχη της τεχνολογίας.

«Θα είναι πιο δύσκολο να δικαιολογήσουμε πολύ μεγάλα περιθώρια κέρδους για αυτό το επίπεδο νοημοσύνης», δήλωσε ο Vipul Ved Prakash, διευθύνων σύμβουλος της Together AI, η οποία πωλεί υπολογιστικές υπηρεσίες σε προγραμματιστές εφαρμογών AI.

Miles Kruppa και Deepa Seetharaman, The Wall Street Journal
Τ.Σ.
Ακολουθήστε το στο Google News και μάθετε πρώτοι όλες τις ειδήσεις
Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, στο