Kiinalainen teknologiajätti Alibaba julkisti uuden tekoälymallin: Qwen 2.5-Max haastaa lännen huipputeknologiat
Wed, 29 Jan 2025 15:06:20 EET
Kiinalainen teknologiayhtiö Alibaba on esitellyt uuden tekoälymallinsa, Qwen 2.5-Maxin, joka yhtiön mukaan päihittää länsimaiset huippumallit, kuten OpenAI:n GPT-4o:n ja Metan Llama-3.1-405B:n, useissa tehtävissä. ([reuters.com](
Alibaba Cloudin mukaan Qwen 2.5-Max on koulutettu yli 20 biljoonalla tokenilla käyttäen "mixture-of-experts" (MoE) -arkkitehtuuria, mikä mahdollistaa korkean suorituskyvyn pienemmillä laskentaresursseilla. ([qwenlm.github.io](
Yhtiö väittää, että Qwen 2.5-Max suoriutuu paremmin kuin DeepSeek V3 useissa keskeisissä vertailuissa, kuten Arena-Hard, LiveBench ja LiveCodeBench, sekä kilpailee tasavertaisesti GPT-4o:n ja Claude-3.5-Sonnetin kanssa edistyneessä päättelyssä ja tiedonhallinnassa. ([venturebeat.com](
Tämä julkistus tulee vain päiviä sen jälkeen, kun kiinalainen DeepSeek esitteli oman R1-mallinsa, mikä on herättänyt huolta Yhdysvaltojen teknologisesta etumatkasta. ([apnews.com](
Analyytikot huomauttavat, että Qwen 2.5-Maxin MoE-arkkitehtuuri voi vähentää infrastruktuurikustannuksia 4060 % perinteisiin suuriin kielimalleihin verrattuna, mikä saattaa houkutella yrityksiä harkitsemaan sen käyttöönottoa. ([venturebeat.com](
Kuitenkin asiantuntijat kehottavat yrityksiä arvioimaan huolellisesti tekijöitä, kuten datan suvereniteettia, API:n luotettavuutta ja pitkäaikaista tukea, ennen kuin päättävät uuden teknologian käyttöönotosta. ([venturebeat.com](
Qwen 2.5-Maxin julkaisu korostaa, kuinka kiinalaiset teknologiayritykset pyrkivät nopeasti saavuttamaan ja jopa ohittamaan länsimaiset kilpailijansa tekoälyn alalla.
Lähteet
1. Reuters: [Alibaba releases AI model it claims surpasses DeepSeek V3](