最新一期 LiveBench 放榜,我们的旗舰模型Qwen3-235B-A22B登顶「全球开源模型冠军」,小尺寸的Qwen3-32B则位列全球开源模型Top3。同时,千问3在指令遵循(Instruction Following)这一关键能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等顶级闭源模型,斩获全球第一,这也表明千问3具备全球🔝的语言理解和生成能力。
LiveBench是由图灵奖得主Yann LeCun联合Abacus.AI、纽约大学发起,聚焦AIGC领域模型能力测评,其核心亮点在于动态防污染机制——每月基于最新数据集、arXiv论文、新闻热点和IMDb电影梗概生成新问题,覆盖6大类18项任务,形成持续更新的评估体系。该榜单被誉为「全球首个无法被操纵的LLM基准测试」。LiveBench 的目标是提供一个公平、全面且不断发展的评估工具,帮助研究人员和开发者更好地理解和改进语言模型
千问3独特的混合推理架构,支持即时响应与深度推理双模式切换,还可通过"思考预算"机制满足性能与成本的各种需求;千问3提供119种语言和方言支持,为全球化应用提供坚实支撑;千问3还拥有强大的Agent智能体能力,通过优化编码效率与MCP支持,可实现手机、电脑高效操作及复杂任务处理。
目前阿里云百炼平台已全线上架Qwen3 模型,可直接在阿里云百炼控制台直接体验!!!也可以参考api文档直接通过api进行调用。
目前上阿里云百炼体验Qwen3,每个模型免费获得各100万 Token,有效期为百炼开通后180天内,qwen-plus-2025-04-28、qwen-turbo-2025-04-28已升级Qwen3,赶快来体验一下Qwen3的能力吧~~
👉Qwen3模型直接体验入口🔗https://bailian.console.aliyun.com/?tab=model#/model-market?name=qwen3
🔗https://bailian.console.aliyun.com/?tab=model#/model-market
🏀如果想要了解更多通义大模型的模型详细信息以及直接进入体验,可以点击🔗https://www.aliyun.com/product/tongyi直接进入查看和体验哦~~