Ο κινεζικός κολοσσός Alibaba κυκλοφόρησε νέα έκδοση του μοντέλου τεχνητής νοημοσύνης Qwen 2.5 που ισχυρίζεται ότι ξεπερνά το DeepSeek-V3.

Η ασυνήθιστη χρονική στιγμή της κυκλοφορίας του Qwen 2.5-Max την πρώτη ημέρα του Σεληνιακού Νέου Έτους, όταν οι περισσότεροι Κινέζοι δεν δουλεύουν και βρίσκονται με τις οικογένειές τους, υποδηλώνει την πίεση που άσκησε η άνοδος της DeepSeek τις τελευταίες τρεις εβδομάδες, όχι μόνο στους ανταγωνιστές στο εξωτερικό, αλλά και τον εγχώριο ανταγωνισμό της.

«Το Qwen 2.5 Max ξεπερνάει σχεδόν σε όλα τα GPT-4o, DeepSeek-V3 και το Llama-3.1-405B» ανέφερε η Alibaba σε ανακοίνωση που δημοσιεύτηκε στον επίσημο λογαριασμό της στο WeChat, αναφερόμενη στα πιο προηγμένα μοντέλα τεχνητής νοημοσύνης της OpenAI και της Meta.

Η κυκλοφορία του βοηθού τεχνητής νοημοσύνης της DeepSeek στις 10 Ιανουαρίου, που τροφοδοτείται από το μοντέλο DeepSeek-V3, καθώς και η κυκλοφορία του μοντέλου R1 στις 20 Ιανουαρίου, έχει σοκάρει τη Silicon Valley και έχει προκαλέσει πτώση των μετοχών τεχνολογίας, καθώς το χαμηλό κόστος της κινεζικής εφαρμογής κάνει τους επενδυτές να αμφισβητούν τα τεράστια ποσά που δαπανούν οι κορυφαίες εταιρείες τεχνητής νοημοσύνης στις Ηνωμένες Πολιτείες.

Αλλά η επιτυχία της κινεζικής startup DeepSeek οδήγησε σε έναν αγώνα μεταξύ των Κινέζων ανταγωνιστών του να αναβαθμίσουν τα δικά τους μοντέλα AI.

Δύο ημέρες μετά την κυκλοφορία του DeepSeek-R1, και η μητρική του TikTok, ByteDance, κυκλοφόρησε ενημέρωση για το κορυφαίο μοντέλο τεχνητής νοημοσύνης της, το οποίο ισχυρίστηκε ότι ξεπέρασε το ο1 της OpenAI που υποστηρίζεται από τη Microsoft, μια δοκιμή αναφοράς που μετρά πόσο καλά τα μοντέλα τεχνητής νοημοσύνης κατανοούν και ανταποκρίνονται σε περίπλοκες οδηγίες.

Αυτό απηχούσε τον ισχυρισμό της DeepSeek ότι το μοντέλο της R1 συναγωνιζόταν το o1 της OpenAI σε πολλούς δείκτες απόδοσης.

