Η κινεζική εταιρεία τεχνολογίας Alibaba (NYSE: BABA) κυκλοφόρησε την Τετάρτη μια νέα έκδοση του μοντέλου τεχνητής νοημοσύνης Qwen 2.5 που ισχυρίστηκε ότι ξεπέρασε το πολύ αναγνωρισμένο DeepSeek-V3.
Η ασυνήθιστη χρονική στιγμή της κυκλοφορίας του Qwen 2.5-Max, την πρώτη ημέρα του Σεληνιακού Νέου Έτους, όταν οι περισσότεροι Κινέζοι είναι εκτός δουλειάς και με τις οικογένειές τους, υποδηλώνει την πίεση που άσκησε η μετεωρική άνοδος της κινεζικής νεοσύστατης τεχνητής νοημοσύνης DeepSeek τις τελευταίες τρεις εβδομάδες. όχι μόνο τους ανταγωνιστές στο εξωτερικό, αλλά και τον εγχώριο ανταγωνισμό της.
“Το Qwen 2.5-Max ξεπερνάει… σχεδόν σε όλα τα GPT-4o, DeepSeek-V3 και Llama-3.1-405B”, ανέφερε η μονάδα cloud της Alibaba σε ανακοίνωση που δημοσιεύτηκε στον επίσημο λογαριασμό της στο WeChat, αναφερόμενη στο OpenAI και το Meta (NASDAQ: τα πιο προηγμένα μοντέλα τεχνητής νοημοσύνης ανοιχτού κώδικα της META).
Η κυκλοφορία του βοηθού τεχνητής νοημοσύνης της DeepSeek στις 10 Ιανουαρίου, που τροφοδοτείται από το μοντέλο DeepSeek-V3, καθώς και η κυκλοφορία του μοντέλου R1 στις 20 Ιανουαρίου, έχει σοκάρει τη Silicon Valley και έχει προκαλέσει πτώση των μετοχών τεχνολογίας, με την υποτιθέμενη χαμηλή ανάπτυξη της κινεζικής startup. το κόστος χρήσης που ωθεί τους επενδυτές να αμφισβητούν τα τεράστια σχέδια δαπανών από κορυφαίες εταιρείες τεχνητής νοημοσύνης στις Ηνωμένες Πολιτείες.
Αλλά η επιτυχία του DeepSeek οδήγησε επίσης σε έναν αγώνα μεταξύ των εγχώριων ανταγωνιστών του να αναβαθμίσουν τα δικά τους μοντέλα AI.
Δύο ημέρες μετά την κυκλοφορία του DeepSeek-R1, ο ιδιοκτήτης του TikTok ByteDance κυκλοφόρησε μια ενημέρωση για το κορυφαίο μοντέλο τεχνητής νοημοσύνης του, το οποίο ισχυρίστηκε ότι ξεπέρασε το o1 του OpenAI που υποστηρίζεται από τη Microsoft στο AIME, μια δοκιμή αναφοράς που μετρά πόσο καλά τα μοντέλα τεχνητής νοημοσύνης κατανοούν και ανταποκρίνονται σε περίπλοκες οδηγίες.
Αυτό απηχούσε τον ισχυρισμό της DeepSeek ότι το μοντέλο R1 της συναγωνιζόταν το o1 του OpenAI σε πολλά σημεία αναφοράς απόδοσης.
DeepSeek εναντίων εσωτερικού ανταγωνισμού
Ο προκάτοχος του μοντέλου V3 της DeepSeek, το DeepSeek-V2, πυροδότησε πόλεμο τιμών μοντέλων τεχνητής νοημοσύνης στην Κίνα μετά την κυκλοφορία του τον περασμένο Μάιο.
Το γεγονός ότι το DeepSeek-V2 ήταν ανοιχτού κώδικα και άνευ προηγουμένου φθηνό, μόνο 1 γιουάν (0,14 $) ανά 1 εκατομμύριο μάρκες – ή μονάδες δεδομένων που επεξεργάζονται το μοντέλο AI – οδήγησε στη μονάδα cloud της Alibaba να ανακοινώσει περικοπές τιμών έως και 97% σε γκάμα μοντέλων.
Το παράδειγμά τους ακολούθησαν και άλλες κινεζικές εταιρείες τεχνολογίας, συμπεριλαμβανομένης της Baidu (NASDAQ:BIDU), η οποία κυκλοφόρησε το πρώτο αντίστοιχο της Κίνας σε ChatGPT τον Μάρτιο του 2023, και της πιο πολύτιμης εταιρείας Διαδικτύου της χώρας Tencent.
Ο Liang Wenfeng, ο αινιγματικός ιδρυτής του DeepSeek, είπε σε μια σπάνια συνέντευξη στο κινεζικό μέσο ενημέρωσης Waves τον Ιούλιο ότι η startup «δεν νοιαζόταν» για τους πολέμους τιμών και ότι η επίτευξη AGI (τεχνητής γενικής νοημοσύνης) ήταν ο κύριος στόχος της.
Το OpenAI ορίζει το AGI ως αυτόνομα συστήματα που ξεπερνούν τους ανθρώπους στις περισσότερες οικονομικά πολύτιμες εργασίες.
Ενώ μεγάλες κινεζικές εταιρείες τεχνολογίας όπως η Alibaba έχουν εκατοντάδες χιλιάδες υπαλλήλους, το DeepSeek λειτουργεί σαν ερευνητικό εργαστήριο, στελεχωμένο κυρίως από νέους πτυχιούχους και διδακτορικούς φοιτητές από κορυφαία κινεζικά πανεπιστήμια.
Ο Liang είπε στη συνέντευξή του τον Ιούλιο ότι πίστευε ότι οι μεγαλύτερες εταιρείες τεχνολογίας της Κίνας μπορεί να μην είναι κατάλληλες για το μέλλον της βιομηχανίας AI, αντιπαραβάλλοντας το υψηλό κόστος και τις δομές από πάνω προς τα κάτω με τη λιτή λειτουργία και το χαλαρό στυλ διαχείρισης του DeepSeek.
«Τα μεγάλα θεμελιώδη μοντέλα απαιτούν συνεχή καινοτομία, οι δυνατότητες των τεχνολογικών κολοσσών έχουν τα όριά τους», είπε.
πηγή: investing.com

