|
7月23日,阿里巴巴正式宣布開源其最新AI編程大模型Qwen3-Coder,標志著國產AI編程技術邁入全球頂尖行列。該模型采用混合專家(MoE)架構,總參數規模達4800億,激活參數350億,原生支持256K token上下文,并可通過YaRN技術擴展至1M長度,成為目前開源領域最強大的代碼生成與智能體(Agent)模型之一。 Qwen3-Coder基于7.5TB高質量訓練數據,其中代碼占比高達70%,并在后訓練階段強化了編程任務及智能體任務的優化,顯著提升了模型的代碼生成、邏輯推理和多工具協同能力。在SWE-Bench、WebArena等權威評測中,其表現超越GPT-4.1,與Claude Sonnet4比肩,尤其在復雜編程任務的自主規劃與工具調用方面刷新了開源模型紀錄。例如,開發者僅需簡單描述需求,模型即可快速生成高效代碼,甚至能在5分鐘內完成品牌官網開發,大幅提升編程效率。 為助力開發者更高效地使用Qwen3-Coder,阿里云同步開源了命令行工具Qwen Code,支持與Claude Code、Cline等工具的協同工作。該模型已在魔搭社區、Hugging Face等平臺開放下載,并將很快集成至阿里AI編程產品通義靈碼,API服務也已上線阿里云百煉平臺。 目前,通義千問系列編程模型全球下載量已突破2000萬次,阿里巴巴內部及一汽集團、中國石油、建設銀行等行業頭部企業均已采用該技術推動業務智能化升級。此次Qwen3-Coder的開源,將進一步降低AI編程門檻,加速全球開發者生態的創新與發展。 |