Η DeepSeek, μια κινεζική νεοφυής επιχείρηση τεχνητής νοημοσύνης που έχει ηλικία μόλις ενός έτους, έχει προκαλέσει δέος και αποτροπιασμό στη Silicon Valley μετά την επίδειξη πρωτοποριακών μοντέλων τεχνητής νοημοσύνης που προσφέρουν συγκρίσιμες επιδόσεις με τα καλύτερα chatbots του κόσμου σε φαινομενικά ένα κλάσμα του κόστους.
Η εμφάνιση της DeepSeek μπορεί να προσφέρει έναν αντίλογο στην ευρέως διαδεδομένη πεποίθηση ότι το μέλλον της τεχνητής νοημοσύνης θα απαιτεί ολοένα και μεγαλύτερες ποσότητες ισχύος και ενέργειας για την ανάπτυξή της.
Οι παγκόσμιες τεχνολογικές μετοχές έπεσαν στα τέλη Ιανουαρίου, καθώς ο θόρυβος γύρω από την καινοτομία της DeepSeek πήρε διαστάσεις χιονοστιβάδας και οι επενδυτές άρχισαν να αφομοιώνουν τις επιπτώσεις για τους αντιπάλους της με έδρα τις ΗΠΑ και τους προμηθευτές υλικού τους.
Τι ακριβώς είναι η DeepSeek;
Η DeepSeek ιδρύθηκε το 2023 από τον Liang Wenfeng, τον επικεφαλής του AI-driven quant hedge fund High-Flyer. Η εταιρεία αναπτύσσει μοντέλα τεχνητής νοημοσύνης που είναι ανοικτού κώδικα, πράγμα που σημαίνει ότι η κοινότητα προγραμματιστών στο σύνολό της μπορεί να επιθεωρεί και να βελτιώνει το λογισμικό. Η εφαρμογή της για κινητά εκτοξεύτηκε στην κορυφή των charts λήψης iPhone στις ΗΠΑ μετά την κυκλοφορία της στις αρχές Ιανουαρίου.
Η εφαρμογή διακρίνεται από άλλα chatbots, όπως το ChatGPT της OpenAI, αρθρώνοντας το σκεπτικό της πριν δώσει απάντηση σε μια προτροπή. Η εταιρεία ισχυρίζεται ότι η έκδοση R1 της προσφέρει επιδόσεις εφάμιλλες με τις τελευταίες του OpenAI και έχει παραχωρήσει άδεια σε άτομα που ενδιαφέρονται να αναπτύξουν chatbots χρησιμοποιώντας την τεχνολογία για να βασιστούν σε αυτήν.
Πώς συγκρίνεται το DeepSeek R1 με το OpenAI ή το Meta AI;
Αν και δεν έχει δοθεί πλήρης λεπτομέρεια από την εταιρεία, το κόστος εκπαίδευσης και ανάπτυξης των μοντέλων της DeepSeek φαίνεται να είναι μόνο ένα κλάσμα αυτού που απαιτείται για τα καλύτερα προϊόντα του OpenAI ή της Meta Platforms Inc. Η πολύ καλύτερη αποδοτικότητα του μοντέλου θέτει υπό αμφισβήτηση την ανάγκη για τεράστιες δαπάνες κεφαλαίων για την απόκτηση των τελευταίων και ισχυρότερων επιταχυντών τεχνητής νοημοσύνης από εταιρείες όπως η Nvidia Corp. Αυτό ενισχύει επίσης την προσοχή στους περιορισμούς των εξαγωγών τέτοιων προηγμένων ημιαγωγών από τις ΗΠΑ προς την Κίνα – οι οποίοι είχαν ως στόχο να αποτρέψουν μια ανακάλυψη του είδους που φαίνεται να αντιπροσωπεύει το DeepSeek.
Η DeepSeek λέει ότι το R1 είναι κοντά ή καλύτερο από τα ανταγωνιστικά μοντέλα σε διάφορα κορυφαία benchmarks, όπως το AIME 2024 για μαθηματικές εργασίες, το MMLU για γενικές γνώσεις και το AlpacaEval 2.0 για την απόδοση ερωτήσεων και απαντήσεων. Κατατάσσεται επίσης μεταξύ των κορυφαίων επιδόσεων σε έναν πίνακα κατάταξης που συνδέεται με το UC Berkeley και ονομάζεται Chatbot Arena.
Τι προκαλεί συναγερμό στις ΗΠΑ;
Η Ουάσινγκτον απαγόρευσε την εξαγωγή τεχνολογιών υψηλής τεχνολογίας, όπως ημιαγωγοί GPU, στην Κίνα, σε μια προσπάθεια να ανακόψει την πρόοδο της χώρας στην τεχνητή νοημοσύνη, το βασικό σύνορο στον ανταγωνισμό ΗΠΑ-Κίνας για την τεχνολογική υπεροχή. Αλλά η πρόοδος της DeepSeek υποδηλώνει ότι οι Κινέζοι μηχανικοί τεχνητής νοημοσύνης έχουν καταφέρει να παρακάμψουν τους περιορισμούς, εστιάζοντας σε μεγαλύτερη αποτελεσματικότητα με περιορισμένους πόρους. Αν και παραμένει ασαφές σε πόσο προηγμένο υλικό εκπαίδευσης AI είχε πρόσβαση η DeepSeek, η εταιρεία έχει επιδείξει αρκετά στοιχεία που υποδηλώνουν ότι οι εμπορικοί περιορισμοί δεν ήταν απολύτως αποτελεσματικοί στην παρεμπόδιση της προόδου της Κίνας.
Πότε η DeepSeek προκάλεσε παγκόσμιο ενδιαφέρον;
Η εταιρεία ανάπτυξης τεχνητής νοημοσύνης παρακολουθείται στενά από την κυκλοφορία του πρωιμότερου μοντέλου της το 2023. Στη συνέχεια, τον Νοέμβριο, έδωσε στον κόσμο μια γεύση από το μοντέλο συλλογισμού DeepSeek R1, σχεδιασμένο να μιμείται την ανθρώπινη σκέψη. Αυτό το μοντέλο στηρίζει την εφαρμογή chatbot για κινητά, η οποία μαζί με τη διαδικτυακή διεπαφή τον Ιανουάριο εκτοξεύθηκε σε παγκόσμια φήμη ως μια πολύ φθηνότερη εναλλακτική λύση του OpenAI, με τον επενδυτή Marc Andreessen να την αποκαλεί «η στιγμή Σπούτνικ της AI».
Η εφαρμογή DeepSeek για κινητά είχε κατέβει 1,6 εκατομμύρια φορές μέχρι τις 25 Ιανουαρίου και κατέλαβε την 1η θέση στα καταστήματα εφαρμογών για iPhone στην Αυστραλία, τον Καναδά, την Κίνα, τη Σιγκαπούρη, τις ΗΠΑ και το Ηνωμένο Βασίλειο, σύμφωνα με τα στοιχεία της εταιρείας παρακολούθησης της αγοράς App Figures.
Ποιος είναι ο ιδρυτής της DeepSeek;
Ο Liang γεννήθηκε στην Guangdong το 1985 και έλαβε πτυχίο και μεταπτυχιακό στην ηλεκτρονική μηχανική και την πληροφορική από το Πανεπιστήμιο Zhejiang. Ίδρυσε την DeepSeek με εγγεγραμμένο κεφάλαιο 10 εκατομμυρίων γιουάν (1,4 εκατομμύρια δολάρια), σύμφωνα με τη βάση δεδομένων της εταιρείας Tianyancha.
Το εμπόδιο για περαιτέρω πρόοδο δεν είναι η μεγαλύτερη συγκέντρωση κεφαλαίων, δήλωσε ο Liang σε συνέντευξή του στο κινεζικό πρακτορείο 36kr, αλλά οι περιορισμοί των ΗΠΑ στην πρόσβαση στα καλύτερα τσιπ. Οι περισσότεροι από τους κορυφαίους ερευνητές του ήταν φρέσκοι απόφοιτοι κορυφαίων κινεζικών πανεπιστημίων, είπε, τονίζοντας την ανάγκη η Κίνα να αναπτύξει το δικό της εγχώριο οικοσύστημα, παρόμοιο με αυτό που έχει δημιουργηθεί γύρω από την Nvidia και τα τσιπ τεχνητής νοημοσύνης της.
“Οι περισσότερες επενδύσεις δεν οδηγούν απαραίτητα σε περισσότερη καινοτομία. Διαφορετικά, οι μεγάλες εταιρείες θα καταλάβουν όλη την καινοτομία», δήλωσε ο Liang.
Πού βρίσκεται η DeepSeek στο τοπίο της AI στην Κίνα;
Οι τεχνολογικοί ηγέτες της Κίνας, από την Alibaba Group Holding Ltd. και την Baidu Inc. έως την Tencent Holdings Ltd., έχουν ρίξει σημαντικά χρήματα και πόρους στον αγώνα για την απόκτηση υλικού και πελατών για τα εγχειρήματά τους στον τομέα της τεχνητής νοημοσύνης. Παράλληλα με την 01.AI startup του Kai-Fu Lee, η DeepSeek ξεχωρίζει με την προσέγγιση ανοιχτού κώδικα – σχεδιασμένη να προσλάβει γρήγορα τον μεγαλύτερο αριθμό χρηστών πριν αναπτύξει στρατηγικές νομισματοποίησης πάνω σε αυτό το μεγάλο κοινό.
Επειδή τα μοντέλα της DeepSeek είναι πιο προσιτά, έχει ήδη συμβάλει στη μείωση του κόστους για τους προγραμματιστές AI στην Κίνα, όπου οι μεγαλύτεροι παίκτες έχουν εμπλακεί σε έναν πόλεμο τιμών που έχει δει διαδοχικά κύματα μειώσεων τιμών κατά τον τελευταίο ενάμιση χρόνο.
Ποιες είναι οι συνέπειες για την παγκόσμια αγορά τεχνητής νοημοσύνης;
Η επιτυχία της DeepSeek μπορεί να ωθήσει την OpenAI και άλλους παρόχους των ΗΠΑ να μειώσουν τις τιμές τους για να διατηρήσουν το καθιερωμένο προβάδισμά τους. Θέτει επίσης υπό αμφισβήτηση τις τεράστιες δαπάνες από εταιρείες όπως η Meta και η Microsoft Corp. – καθεμία από τις οποίες έχει δεσμευτεί για επενδύσεις ύψους 65 δισεκατομμυρίων δολαρίων ή και περισσότερο φέτος, κυρίως σε υποδομές τεχνητής νοημοσύνης – εάν πιο αποδοτικά μοντέλα μπορούν να ανταγωνιστούν με πολύ μικρότερη δαπάνη. Αυτό αναστάτωσε τα χρηματιστήρια της Ασίας, καθώς οι επενδυτές αναζήτησαν κινεζικά ονόματα που συνδέονται με την DeepSeek, όπως η Iflytek Co., και απομακρύνθηκαν από ονόματα της εφοδιαστικής αλυσίδας παραγωγής τσιπ, όπως η Advantest Corp. που μπορεί να είναι εκτεθειμένα σε οποιαδήποτε έλλειψη στην αναμενόμενη ζήτηση για ημιαγωγούς AI.
Ήδη, προγραμματιστές σε όλο τον κόσμο πειραματίζονται με το λογισμικό της DeepSeek και επιδιώκουν να δημιουργήσουν εργαλεία με αυτό. Αυτό θα μπορούσε να επιταχύνει την υιοθέτηση προηγμένων μοντέλων συλλογιστικής ΤΝ – ενώ ενδεχομένως να προκαλέσει πρόσθετη ανησυχία σχετικά με την ανάγκη για προστατευτικές μπάρες γύρω από τη χρήση τους. Η πρόοδος της DeepSeek μπορεί να επιταχύνει τη ρύθμιση για τον έλεγχο του τρόπου ανάπτυξης της τεχνητής νοημοσύνης.
Ποιες είναι οι αδυναμίες του DeepSeek;
Όπως όλα τα άλλα κινεζικά μοντέλα τεχνητής νοημοσύνης, το DeepSeek αυτολογοκρίνεται σε θέματα που θεωρούνται ευαίσθητα στην Κίνα. Αποφεύγει ερωτήματα σχετικά με τις διαδηλώσεις στην πλατεία Τιενανμέν το 1989 ή γεωπολιτικά φορτισμένα ερωτήματα, όπως το ενδεχόμενο εισβολής της Κίνας στην Ταϊβάν. Σε δοκιμές, το ρομπότ DeepSeek είναι ικανό να δίνει λεπτομερείς απαντήσεις για πολιτικές προσωπικότητες όπως ο Ινδός πρωθυπουργός Ναρέντρα Μόντι, αλλά αρνείται να το κάνει για τον Κινέζο πρόεδρο Σι Τζινπίνγκ.
Η υποδομή cloud του DeepSeek είναι πιθανό να δοκιμαστεί από την ξαφνική δημοτικότητά του. Η εταιρεία αντιμετώπισε για λίγο μια σημαντική διακοπή στις 27 Ιανουαρίου και θα πρέπει να διαχειριστεί ακόμη μεγαλύτερη κίνηση καθώς νέοι και επαναλαμβανόμενοι χρήστες θα στέλνουν περισσότερα ερωτήματα στο chatbot της.
-Με τη βοήθεια των Luz Ding, Zheping Huang, Claire Che, Ville Heiskanen και Mayumi Negishi.
Saritha Rai και Newley Purnell, Yahoo Finance
Τ.Σ.

