4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。

千问3是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,大大节省算力消耗。
千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T ,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中。千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,即创下所有国产模型及全球开源模型的性能新高:在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越OpenAI-o1及DeepSeek-R1。
性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。
值得一提的是,记者获悉,就在同一天,腾讯对其混元大模型研发体系进行了全面重构,围绕算力、算法和数据三大核心板块,刷新团队部署,加码研发投入。
调整后,腾讯成立两个新的部门:大语言模型部和多模态模型部,分别负责探索大语言模型和多模态大模型的前沿技术,持续迭代基础模型,提升模型能力。
同时,进一步加强大模型数据能力和平台底座建设,其中数据平台部专注大模型数据全流程管理与建设,机器学习平台部则聚焦机器学习与大数据融合平台建设,为AI模型训练推理、大数据业务提供全面高效的PaaS平台底座,共同支撑腾讯混元大模型技术研发。
腾讯相关人士表示,这意味着腾讯在快速调整组织架构以应对日新月异的大模型行业发展,这次调整有利于整合资源,优化研发流程,进一步提升腾讯在AI领域的长期技术作战能力。
混元是腾讯自研的通用大模型,支持文本、图像、视频和3D等多种模态内容的理解与生成。今年以来,混元大模型技术迭代速度显著加快,相继推出快思考模型Turbo S和深度思考模型T1,均在公开基准测试中达到业界领先水平,在视频生成和3D生成领域也推出多个新版本模型。混元3D生成、视频生成、DiT文生图及千亿参数MoE语言模型等模型均已对外开源,GitHub总Star数超过2.9万。
近期,国产大模型发展按下提速键,生成式人工智能正带来产业变革。据央视网报道,目前,我国已形成覆盖基础层、框架层、模型层、应用层的完整人工智能产业体系。最新数据显示,截至2025年4月9日,我国人工智能专利申请量达1576379件,占全球申请量的38.58%,位居全球首位。目前,我国已累计培育400余家人工智能领域国家级专精特新“小巨人”企业,占据全球1/10的人工智能产业规模。
编辑|金冥羽 杜波
校对|陈柯名
在最近的腾讯内部大会上,一向低调的马化腾做出了罕见之举,公开评论对手。 他先是表示字节跳动与中兴联合推出的“豆包手机”屏幕录制上传云端的技术路径“极其不安全”。同时,他对阿里巴巴的AI“全家桶”战略...
前脚,马化腾刚在腾讯全员大会上对元宝红包活动寄予厚望;后脚,微信就给马化腾浇了一盆冷水。 今天一早(2 月 4 日),元宝红包分享到微信时打开跳转会出现警告:网页包含诱导分享、关注等诱导行为内容,请长...
香港会议展览中心内,华为、腾讯、蚂蚁数科和度小满等中国科技巨头的展台人头攒动,这些企业在出海征程中,正将中国香港作为撬动全球市场的第一站。 11月3日至7日,香港金融科技周2025在香港会议展览中心...
今年的资本市场,掀起了科技热潮,在这一轮科技热潮中,AI、机器人、芯片等领域上市公司纷纷吸引了资本市场的目光。老牌巨头百度在AI带动下股价大涨,阿里巴巴年内股价也实现翻倍。在这一片火热行情中,BAT中...
其中,字节系的豆包、即梦AI和Cici的增长势头最猛,5月月活分别上涨10.23%、39.86%和17.43%,狠狠的吸了波流量。 时至今日,国内AI产品月活用户过亿,才能算是顶流。百度网盘、夸克、豆...
在刚刚过去的ChinaJoy,射击品类无疑是最火爆的赛道,腾讯、网易、莉莉丝等展台的射击游戏试玩区排起长龙。如今,这种头部厂商“对垒”的局势又延续到8月新游戏市场。 莉莉丝《远光84》展台 秦铭蔚摄...