{label:top}
首页 >> 短看> 正文

阿里 AI 实力获斯坦福权威报告盖章!通义千问贡献排名全球第三、中国第一

来源:短看发布时间:2025-09-09 00:20:35
浏览:35195


近日,阿里斯坦福大学机器智能研究所发布了最新一期《2025年机器智能指数报告》。实力研究报告显示,坦福通义在2024年度全球关键大模型中,权威千问全球中国贡献15项。报告从具体机构分布来看,盖章贡献国第女学生家庭聚会门事件全集谷歌与OpenAI各占7席并列榜首,排名阿里巴巴以6个入选模型紧随其后,第中排名第三。阿里


这份连续发布八年的实力年度报告由斯坦福机器智能实验室主任李飞飞教授领衔编制,自2017年首度发布以来,坦福通义其多维度的权威千问全球评估框架和跨年度的信息追踪,已成为全球学术界和产业界观察AI工艺演进的报告关键参照。

2025年的盖章贡献国第斯坦福报告指出,中国和美国是排名全球AI最具作用力的两大国家,且中美模型的性能差距显著缩小,性能表现由2023年的17.5%骤降至0.3%,差距接近抹平。

而阿里作为入选关键大模型最多的中国科技公司,其入选的6款模型分别为:Qwen-72B、Qwen1.5-72B、Qwen2-72B、Qwen2.5-72B、B站剧情号封号合集Qwen2.5-32B、QwQ-32B,是中国 AI 力量在全球作用力崛起的最大推手。

至今,阿里通义实验室已开源200多款模型。目前千问在全世界的衍生模型数破10万,超越美国Llama成为世界第一开源大模型。

中美差距缩小,阿里通义千问功不可没

美国历来是机器智能研究和模型开发的主导。然而,最近的证据表明,中国模型的性能正在逐步逼近美国。

2024年1月,在LMSYS聊天机器人竞技场上,美国顶级模型的表现优于中国最佳模型9.26%。到了2025年2月,这一差距缩小至仅1.70%。


2023年底,美国领先模型的表现显著优于中国同类模型。在MMLU、MMMU、MATH和HumanEval等基准测试中,中美性能差距分别为17.5、13.5、24.3和31.6个百分点。2024年底,这些差异显著缩小至仅0.3、8.1、1.6和3.7个百分点。


这一关键转变的背后是阿里和DeepSeek的持续努力和爆发。2024年5月24日,阿里巴巴发布开源Qwen2.5,性能超越Llama 405B。2025年1月20日,DeepSeek发布DeepSeek-R1,同步开源模型权重。前有阿里开荒拓土,后有DeepSeek持续发力。如今,阿里和DeepSeek已经成为了中国AI在世界舞台中激烈角逐的两股领先力量。

根据斯坦福的报告,阿里是唯一进入全球大模型贡献前三的中国公司。统计信息显示,在备受关注的全球重大模型榜单中,谷歌与OpenAI分别上榜7个,并列第一。阿里则以6个上榜模型位居全球第三、中国第一。在业内顶级专家评选出的32项“2024年AI领域关键发布”中,阿里Qwen2、Qwen2.5及DeepSeek-V3三大发布上榜。

报告显示,Qwen2.5-72B的训练信息量要略高于Llama-405B和DeepSeek-V3,成为截至2024年训练信息量最大的模型。Qwen2.5全系列模型训练信息量为18 万亿 tokens,而Llama-405B仅仅只有15 万亿tokens的信息量。这意味着Qwen2.5拥有更多的知识、更强的编程和数学能力。


报告中对比了中美两国知名机器学习模型的训练算力,揭示出一个关键趋势:美国顶级AI模型的算力需求普遍远超中国同类产物。这说明,在实现顶尖性能的同时,中国模型所需计算资源显著低于多数主流大语言模型。下图显示,Qwen2.5和DeepSeek-V3的训练算力低于10B,而以Claude 3.5 Sonnet和Grok-2为代表的顶尖模型,算力需求远超于此。


除此之外,闭源与开源LLM之间显著的性能差距也进一步缩小。2024年1月初,领先的闭源模型性能超出顶级开源模型8.0%。而截至2025年2月,这一差距已缩小至1.7%。2024年,Qwen系列模型已超越Llama,成为当前全球最大的开源模型。阿里和DeepSeek作为行业领头羊,有望继续强势扭转开源落后的局面。


在对AI的投入决心方面,阿里在中国是最激进的。就在今年年初,阿里CEO吴泳铭宣布未来三年,阿里预计在AI和云端服务领域投入3800亿元人民币,加速云和AI硬件基础设施建设、提升AI基础模型的研发、推动AI应用的转型升级。

阿里 AI,当之无愧

事实上,2025 年斯坦福 AI 指数报告中阿里大模型的亮眼成绩并非横空出世,而是积步千里。


早在ChatGPT之前,阿里就开启了大模型的研究探索。

2023年4月,“通义千问”大模型正式发布,之后以平均每两个月的速度迭代一次。同年8月Qwen-7B宣布开源,阿里首次加入自研大模型开源行列。

2024,是通义千问爆发的一年。阿里分别在5月、6月、9月、12月推出开源模型Qwen2.5、Qwen2-72B、Qwen2.5-72B、QVQ-72B-Preview。

今年2月,视觉生成基座模型通义万相(Wan)开源,在 VBench中以总分86.22%的成绩稳居榜首。3月,首个端到端全模态大模型Qwen2.5-Omni-7B发布,并于4月登顶Hugging Face开源大模型榜单。

具备强大的、不断迭代的基础模型后,阿里不是“闭关锁国”,而是从 2022 年开始就采取开源措施,将自家的基础模型开放给 AI 社区,继而构建了强大的开源生态。

最新信息显示,通义已接入29万家企业,包括90%互联网公司,90%上市商业银行,90%汽车品牌等。

Qwen开源模型在国内备受青睐,Manus通过Qwen在国产模型和算力平台上实现全部功能,迅速走红于各大社交平台。DeepSeek使用R1蒸馏出6个开源模型,其中有4个来自Qwen。

目前,海内外开源社区中千问Qwen的衍生模型数量已突破10万,稳居世界最大AI大模型族群。根据Huggingface2025年2月10日最新的全球开源大模型榜单,排名前十的开源大模型全部是基于通义千问Qwen开源模型二次开发的衍生模型。

甚至李飞飞等斯坦福大学研究人员也基于阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,仅用不到50美元,便打造出了性能卓越比肩OpenAI的O1和DeepSeek的R1等尖端推理模型的s1-32B模型。


从2023年至今,阿里通义团队已开源200多款模型,囊括文本生成、语音理解、文生图及影片模型等全模态模型,覆盖全尺寸参数,支持29种语言。

通义千问促进中国大模型生态繁荣的背后,是阿里云打下的算力基础。2023年7月7日,阿里云宣布,将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方位的支持,包括最强大的智能算力和开发工具,并在资金和商业化探索方面提供充分支持。


2022年,阿里云在业界首提MaaS(Model as a Service,模型即支持)理念,提出了一种全新的、以AI模型为核心的开发范式。阿里云据此搭建了一套以AI模型为核心的云端服务工艺和支持架构,并将这套能力将全部向大模型初创企业和开发者开放,提供包括模型训练、推理、部署、精调、测评、产物化落地等在内的全方位支持。

截至目前,中国众多头部主流大模型都已通过阿里云对外提供API支持,包括通义系列、Baichuan系列、智谱AI ChatGLM系列等。百川智能创始人兼CEO王小川也曾表示,“百川成立仅半年便发布了7款大模型,快速迭代背后离不开云端服务的支持。”

一些科研机构和创业公司还基于 千问开发了自己的模型和产物。中国科学院国家天文台机器智能工作组基于Qwen开源模型发布了新一代天文大模型“星语3.0”。中国科学院地球化学研究所与阿里云基于Qwen开发了国际首个“月球科学多模态专业大模型”。千问QwQ-32B也成为AI for Science科研领域最受欢迎的大模型之一,已支持300多家科研院所和高校。

2025 年,大模型工艺圈依然热闹非凡。继 DeepSeek席卷全球后,AI Agent 又开启新的大模型产物形态竞争。AI 智能体的进一步增长正在肉眼可见地加深模型应用与基础模型的关联,同时加大推理侧的需求增长。而阿里同时坐拥基础模型与云平台基础设施的两大“护法”,在新一轮的 AGI 竞争中仍有极大优势,拭目以待。

雷峰网(公众号:雷峰网)

雷峰网特约稿件,未经授权禁止转载。详情见转载须知。

阿里 AI 实力获斯坦福权威报告盖章!通义千问贡献排名全球第三、中国第一

独事

更多 >
  • 62岁李连杰突发,已交代身后事
    更新:2025-09-09 00:15
  • 漆远获新融资,阿里云参投;芯原创始人直言百模大战就是“群模乱舞”,是在浪费电;英伟达今年在华将交付超100万颗芯片丨AI情报局
    更新:2025-09-08 23:31
  • 《藏海传》引发观众二次创作的极大热情 “野生编剧”倒逼国产剧精细化创作
    更新:2025-09-08 23:16
  • 联汇科技赵天成:从 CMU 天才少年,到多模态创业先行者
    更新:2025-09-08 21:45

热门文章

  • PPIO亮相WAIC 2025,重磅推出Agentic AI基础设施服务平台
    PPIO亮相WAIC 2025,重磅推出Agentic AI基础设施服务平台

    PPIO亮相WAIC 2025,重磅推出Agentic AI基础设施服务平台

    7月26日至29日,中国领先的独立分布式云计算服务商PPIO亮相2025 世界人工智能大会暨人工智能全球治理高级别会议WAIC)。PPIO联合创始人兼CEO姚欣在WAIC活动上重磅发布了国内首个Age ...

  • 网易云音乐携程《如歌的旅程》原创音乐大赛收官 千万级资源助力城市歌曲破圈
    网易云音乐携程《如歌的旅程》原创音乐大赛收官  千万级资源助力城市歌曲破圈

    网易云音乐携程《如歌的旅程》原创音乐大赛收官 千万级资源助力城市歌曲破圈

    来源标题:网易云音乐携程《如歌的旅程》原创音乐大赛收官 千万级资源助力城市歌曲破圈2025年5月25日,网易云音乐与携程集团联合主办的首届《如歌的旅程》“一座城一首BGM”原 ...

  • 字节跳动发布豆包大模型,主力模型比行业价格低99.3%
    字节跳动发布豆包大模型,主力模型比行业价格低99.3%

    字节跳动发布豆包大模型,主力模型比行业价格低99.3%

    5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎总裁谭待介绍,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿To ...

  • 200 亿估值之后,中国大模型公司还能拿谁的钱?
    200 亿估值之后,中国大模型公司还能拿谁的钱?

    200 亿估值之后,中国大模型公司还能拿谁的钱?

    【雷峰网(公众号:雷峰网)】「无论是美元基金,还是人民币基金,大家普遍觉得,大模型公司估值超越 200 亿人民币)是一个槛。」投资人林秋实告诉 AI 科技评论。「200 亿」成为高风险投资代名词的直接 ...

  • AI 颠覆的第一个职业是程序员?丨GAIR Live
    AI 颠覆的第一个职业是程序员?丨GAIR Live

    AI 颠覆的第一个职业是程序员?丨GAIR Live

    当 AI 大模型飞速进化,最先被卷入洪流的,不是写作画画或运营,而是程序员。过去几年,从 GitHub Copilot 开始,到 Cursor、Codeium、Claude Code,再到各类 Age ...

  • 大模型时代下的数字安全答案,藏在一本实战指南里
    大模型时代下的数字安全答案,藏在一本实战指南里

    大模型时代下的数字安全答案,藏在一本实战指南里

    作者:郭思编辑:陈彩娴在大模型不断成熟的背景下,企业也日益倾向于在云端大规模应用AI技术。这一进程中,以往可能忽视的数据资源,突显出了前所未有的战略意义,数据的价值评估随之动态调整。与此同时,企业上云 ...

  • WAIC 最具技术想象力成果发布:新架构面壁小钢炮又一次验证并加速了面壁定律
    WAIC 最具技术想象力成果发布:新架构面壁小钢炮又一次验证并加速了面壁定律

    WAIC 最具技术想象力成果发布:新架构面壁小钢炮又一次验证并加速了面壁定律

    2020 年,1750 亿参数规模的 GPT-3 问世。彼时,完整训练 1750 亿参数的模型需要 3.14E11TFLOPS)的每秒浮点运算量。如果使用英伟达 80GB A100 GPU16位浮点算 ...

  • Fellows Fund 创始人 Alex Ren :硅谷视角下的 AI 价值创造丨GAIR 2023
    Fellows Fund 创始人 Alex Ren :硅谷视角下的 AI 价值创造丨GAIR 2023

    Fellows Fund 创始人 Alex Ren :硅谷视角下的 AI 价值创造丨GAIR 2023

    2023 年 8 月 14 日,由 GAIR 研究院、雷峰网、世界科技出版社、科特勒咨询集团联合主办的第七届 GAIR 全球人工智能与机器人大会在新加坡乌节大酒店拉开帷幕。在 AI 创业大爆发的时代, ...

热门大瓜

更多 >
  • “特朗普逼李在明选:要么一起对付中国,要么割地”
    “特朗普逼李在明选:要么一起对付中国,要么割地”

    【文/观察者网 熊超然】当地时间8月25日,韩国总统李在明前往白宫会见美国总统特朗普。尽管李在明的发言人会后坚称,这是一次“建立融洽关系的会面”,“会晤气氛热烈,无需发表书面联合声明”,但实际上,两国 ...

  • 银幕对话:中外影史的多重奏
    银幕对话:中外影史的多重奏

    来源标题:银幕对话:中外影史的多重奏影片《放大》把镜头对准了“摇摆六十年代”的伦敦时尚文化。开票一小时内,售罄600多场次——第27届上海国际电影节创造 ...

  • 无限光年发布光语大模型,以灰盒可信技术深耕专业场景,赋能千行百业
    无限光年发布光语大模型,以灰盒可信技术深耕专业场景,赋能千行百业

    7月4日,可信大模型公司无限光年INF)在2024年世界人工智能大会WAIC)上发布可信光语大模型及其技术报告。可信光语大模型结合大语言模型与符号推理,有效解决幻觉问题,大幅增强模型可信度,赋能金融服 ...

  • 在海外,Sora 正在被可灵替代
    在海外,Sora 正在被可灵替代

    从没想过中国第一个让国外网友求着开放会员订阅通道的AI应用居然是出自快手。在经历一个多月的狂奔吸引上百万人排队内测之后快手可灵终于全面开放,最有意思的是直到开放测试之前还有网友表示自己没排进去内测。狗 ...

  • 黄杨钿甜复出了,劣迹艺人的标准究竟是什么?
    黄杨钿甜复出了,劣迹艺人的标准究竟是什么?

    8月20日,搜狐娱乐一条视频,把“天价耳环”事件中的黄杨钿甜重新推到了舆论的聚光灯下。画面中,她在横店拍摄《冰湖重生》,粉丝仍然温声喊着“宝宝,好久不见”。要知道,就在几个月前,她还是“天价耳环”事件 ...

  • 联汇科技赵天成:从 CMU 天才少年,到多模态创业先行者
    联汇科技赵天成:从 CMU 天才少年,到多模态创业先行者

    CMU LTI 卡内基梅隆大学语言技术研究所)每年在全球范围内只有十个左右的博士录取名额,其中的华人学者凤毛麟角。本次以 OpenAI 发布 ChatGPT 为标志掀起的人工智能浪潮,CMU 也在各大 ...

  • 对话优刻得季昕华:竞争大模型不是有卡就能躺赢
    对话优刻得季昕华:竞争大模型不是有卡就能躺赢

    作者丨何思思编辑丨林觉民“一定程度上,美国的算力禁用会造成国内大模型发展的限制,因为没有核心算力就没办法训练模型。”之于算力对于大模型的重要性,优刻得董事长兼CEO季昕华如是说。自今年2月份大模型在国 ...

  • “褚大人”沙宝亮50岁逆袭,老婆戴笑盈被宠成少女
    “褚大人”沙宝亮50岁逆袭,老婆戴笑盈被宠成少女

    来源标题:“褚大人”沙宝亮50岁逆袭,老婆戴笑盈被宠成少女凭借热播剧《藏海传》中“褚大人”一角的精湛演绎,50岁的沙宝亮迎来事业新高峰。当观众为他亦正亦邪的演技喝彩时,镜头外的 ...

  • 俄罗斯发布解密文件揭示731部队人体实验罪行,外交部回应
    俄罗斯发布解密文件揭示731部队人体实验罪行,外交部回应

    #中方回应俄方揭露731部队罪行# 【俄罗斯发布解密文件揭示731部队人体实验罪行,外交部回应】在8月21日外交部例行记者会上,有记者提问称,据报道,俄罗斯政府近日发布的解密文件显示,二战期间,侵华日 ...

  • 外媒紧盯:中国对美出口暴增660%
    外媒紧盯:中国对美出口暴增660%

    【文/观察者网 柳白】外媒近来紧盯中国稀土出口管制。路透社7月20日报道注意到,中国6月对美国的稀土磁体出口量激增至5月的七倍以上。这标志着在中美达成贸易协议后,电动汽车和风力涡轮机所需关键矿产供应强 ...

  • 雷峰网「GAIR 2023 GPT Pioneer 5」揭晓:GPT激流中的5位「领潮儿」
    雷峰网「GAIR 2023 GPT Pioneer 5」揭晓:GPT激流中的5位「领潮儿」

    7年前,阿尔法狗AlphaGo)和李世石的那场人机大战,整个科技圈都轰动了。2016年,AlphaGo以4:1击败世界围棋冠军李世石,这场人机大战结束后,中国棋手柯洁表示,自己有信心战胜阿尔法狗,但最 ...

  • 新加坡国立大学尤洋:高性能 AI 的突破丨GAIR 2023
    新加坡国立大学尤洋:高性能 AI 的突破丨GAIR 2023

    过去数年,AI 模型的参数发生了极大变化。尤洋指出,从 2016 年至 2021 年 1 月,AI 模型的参数量是每 18 个月增长 40 倍;从 2018 年 1 月到 2021 年 1 月,AI ...

风谈风巴基斯坦季风暴雨已致750人死亡
专讯5人走私禽流感冻鸭做酱板鸭,一审获刑
专站阿里玉伯创业AI原生在线办公,首轮估值过亿;StabilityAI4亿美元债务一笔勾销;Perplexity获新投资丨AI情报局
风站新周志华当选新一任国际人工智能联合会(IJCAI)理事会主席
看汇最后冲刺! 人身险产品切换倒计时
全榜北京卫视《养生堂》联手安利纽崔莱破圈合作:用短剧“小屏幕”撬动健康“大生态”

风谈看

更多 >