根據(jù)大模型測(cè)評(píng)榜LiveBench發(fā)表最新一期排名,阿里巴巴(9988)開源的新一代通義千問模型Qwen3,成為全球開源模型冠軍。

香港文匯報(bào)訊(記者 黎梓田)根據(jù)大模型測(cè)評(píng)榜LiveBench發(fā)表最新一期排名,阿里巴巴(9988)開源的新一代通義千問模型Qwen3,成為全球開源模型冠軍。Qwen3亦在指令遵循(Instruction Following)這一關(guān)鍵能力上超越OpenAI的o3 High、o4-Mini High及谷歌(Google)旗下Gemini 2.5 pro等頂級(jí)閉源模型,位列全球第一。

LiveBench榜單從數(shù)學(xué)、推理、編程、語言理解等多個(gè)複雜維度,全面評(píng)估大模型,因其採用動(dòng)態(tài)更新的題庫,被譽(yù)為「全球首個(gè)無法作弊的模型基準(zhǔn)測(cè)試」。

阿里開源Qwen3,包括兩個(gè)混合專家(MoE)模型及6個(gè)密集模型,參數(shù)範(fàn)圍由6億到2350億不等。Qwen3支援119種語言及方言,不但採用混合專家架構(gòu),更是阿里首次推出「混合推理模型」,可以花時(shí)間「推理」複雜問題,或快速回答更簡(jiǎn)單的請(qǐng)求。