{label:top}
首页 >> 风趣事> 正文

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

来源:风趣事发布时间:2025-09-09 14:44:42
浏览:853

下周苹果即将召开发布会了!端侧

但最令笔者期待的清华前不是 iphone16,而是模型苹果今年提出的 Apple Intelligence 的进展,这是公司赶O果苹果今年进军端侧 AI 的一大杀手锏。

其实早在今年年初,端侧国内就有一家当时还名不见经传的清华前郑州中学偷拍视频下载大模型公司率先喊出 “端侧AI是未来大趋势”的口号,当时还没有太多玩家意识到端侧AI的模型关键性。仅仅半年后,公司赶O果谷歌、端侧苹果等巨头就纷纷掉头转向,清华前开始大模型反卷小型化,模型就连 OpenAI 也一反“大力出奇迹”的公司赶O果常态,不得不顺应端侧AI大趋势,端侧推出的清华前更小、更便宜、模型更高效的 GPT-4o mini。

可以说,端侧AI 已然成为了大模型必争之地!

然而就在苹果发布会一周前这个时间点,同样是这家国内大模型公司,率先把「 ChatGPT 」跑在了端侧!宣告了端侧 ChatGPT 时刻的到来!而且还在赶在OpenAI、谷歌、苹果等巨头之前。

没错,这家公司就是面壁智能,今天刚刚发布了新一代基座模型面壁小钢炮 MiniCPM 3.0 ,再次以小博大,重庆大学泄露攻略以 4B 参数,带来超越 GPT-3.5 的性能,强得不像端侧模型。

这还是一款瑞士军刀般全面开挂的基座模型,一口气带来:

无限长文本,榜单性能超越 Kimi,超长文本也不崩;

性能比肩 GPT-4o 的端侧最强 Function Calling;

超强 RAG 外挂三件套,中文检索第一、生成超 Llama3-8B。

➤  MiniCPM 3.0 开源地址:

GitHub:https://github.com/OpenBMB/MiniCPM

HuggingFace:https://huggingface.co/openbmb/MiniCPM3-4B


1.让 「GPT-3.5 」在端侧跑起来,面壁提前兑现承诺

今年年初,面壁在初代面壁小钢炮发布时立下 Flag:今年内让 GPT-3.5 水平的模型在端侧跑起来!

没想到,面壁智能总是能给人惊喜,他们提前兑现了承诺,提前近 4 个月将其实现!

MiniCPM 3.0 再次挖掘端侧模型的极致性能,仅 4B 参数,在包括自然语言理解、知识、代码、数学等多项能力上对 GPT-3.5 实现赶超,在 Qwen2-7B、 Phi-3.5、GLM4-9B、LLaMa3-8B 等一众中外知名模型脱颖而出。

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前


2.大模型科学化方法论指导,面壁定律再落一子

为何每一代面壁小钢炮基座模型的发布,都以小博大,拥有超预期的高效与强悍?

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

背后原因,AI科技评论早在半年前就曾深入挖掘并报道:被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线

面壁紧紧围绕 Scaling Law 的核心,高效构建了大模型的科学化方法论,将提升知识密度视为高效大模型的第一性原理(知识密度 =模型能力/参与计算的模型参数),并且提出了大模型时代的「摩尔定律」:模型知识密度不断提升,平均每 8 个月提升一倍,称之为「面壁定律」。

这一年来,面壁在自家的大模型科学化方法论指导下,历经数次调整,构建了全新工艺架构,于面壁定律的趋势曲线再落一子。

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

不止是基座模型,面壁的多模态模型同样优秀的不像是款端侧模型!

他们一个月前发布的 MiniCPM-V 2.6,首次在端侧实现单图、多图、影片理解等多模态核心能力全面超越GPT-4V,三项能力均取得 20B 以下 SOTA 成绩,单图理解越级比肩 Gemini 1.5 Pro 和 GPT-4o mini。

总结来说:

基座模型方面:面壁率先让 「GPT-3.5 」在端侧跑起来;

多模态模型方面:面壁同样率先让「GPT-4V」跑在手机上!

下面详细介绍一下面壁新一代性能超越 GPT-3.5的 面壁小钢炮 MiniCPM 3.0。


3.顶尖实力大集结,大模型中的“瑞士军刀”

新一代小钢炮集长文本、Function Call 与 RAG 等大模型关键能力于一身,小而强,小而全。仅4B体量,在这些呼声极高的模型功能上,MiniCPM 3.0 集结各家所长,并且对业界颇有口碑的模型实现超越,堪称是大模型中的“瑞士军刀”。

面壁「无限」长文本,性能超 Kimi:长长长文本不崩!

上下文长度是衡量大模型基础能力的一项关键指标,更长的上下文长度意味大模型拥有更大的“内存”和更长的“记忆”,不仅能提高大模型处理信息的能力上限,还能拓宽大模型应用的广度和深度。

面壁提出 LLMxMapReduce长本文分帧处理工艺  ,一举实现「无限」长文本!32, 128, 256, 512K…MiniCPM 3.0 打破大模型记忆限制,可以将上下文长度无限稳定拓展,想多长就多长!

除了超越 GPT-4、KimiChat 等标杆模型的优异表现( InfiniteBench 榜单成绩);更神奇的是,文本越长,这个4B小钢炮凭借愈加稳定的表现,展现出的性能优势越强。

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

InfiniteBench大模型长文本能力的权威评测集 检索、数学、代码、问答和摘要等多维度能力评估

① MiniCPM 3.0 表现超越 GPT-4、KimiChat、Qwen2-70B;

② 千亿模型 Qwen2-70B、Llama3-70b 结合LLMxMapReduce也取得更佳表现。

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

InfiniteBench Zh.QA 评测结果显示,4B参数的面壁小钢炮整体性能优于Kimi,在更长的文本上表现出相较更强的稳定性。

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

LLMxMapReduce 工艺框架图

拥有无限上下文, 可以让模型一次性读取不限字数的书籍或不限量的学术论文、简历等材料,成为你身边更加强大的终端个人助手。模型还可以读取你的大众点评美食、酒店评价、微博互动内容,并牢牢记住你和AI 跨越多年的聊天记录,成为最懂你的AI陪伴者。

GPT-4o 级 Function calling ,终端Agent应用蓄势待发

智能体应用是端侧AI 必争之地,其中一项至关关键的工艺是 Function Calling(函数调用),它能够将客户模糊化的输入语义转换为机器可以精确理解执行的结构化指令,并让大模型连接外部工具和系统,例如通过语音在手机上调用日历、天气、邮件、浏览器等 APP 或相册、文件等本地信息库,从而打开终端设备 Agent 应用的无限可能,也让人机交互更加自然和方便。

MiniCPM 3.0 拥有端侧最强 Function calling 性能 ,在权威评测榜单 Berkeley Function-Calling Leaderboard 上,其性能接近 GPT-4o,并超越 Llama 3.1-8B、Qwen-2-7B、GLM-4-9B 等众多模型。

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

RAG 外挂三件套,中文检索第一,生成超 Llama3-8B

端侧模型也能开外挂,RAG(检索增强生成工艺)让模型引用外部知识库,检索到最新、最可靠的专业知识,确保生成内容更加可信,大大减少大模型的幻觉问题。大模型+RAG 在行业中极其实用,尤其是对法律、医疗等依赖专业知识库、对大模型幻觉容忍度极低的垂直行业。

我们一口气带来超强 RAG 外挂三件套:MiniCPM-Embedding(检索模型)、MiniCPM-Reranker(重排序模型)和面向 RAG 场景的 LoRA 插件(生成模型),款款优秀:

MiniCPM-Embedding(检索模型)中英跨语言检索取得 SOTA 性能,在评估模型文本嵌入能力的权威评测集 MTEB 的检索榜单上中文第一、英文第十三 ;

MiniCPM-Reranker(重排序模型)在中文、英文、中英跨语言测试上取得 SOTA 性能 ;

经过针对 RAG 场景的 LoRA 训练后,MiniCPM 3.0-RAG-LoRA 在开放域问答(NQ、TQA、MARCO)、多跳问答(HotpotQA)、对话(WoW)、事实核查(FEVER)和信息填充(T-REx)等多项任务上的性能表现,超越 Llama3-8B 和 Baichuan2-13B 等业内优秀模型。

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前


4.保障,可靠,皮实,端侧大模型就看面壁小钢炮

轻、快、高效低成本,更友好的端侧体验,是面壁小钢炮系列一以贯之的优点。MiniCPM 3.0 量化后仅 2.2 G 内存,端侧应用十分友好。

相比云端模型,面壁小钢炮 MiniCPM 系列模型有一颗陪你行走世界的大心脏,天然具有弱网、断网可用、超低时延、信息隐私保障等本地优势。无论是陪你闯荡精彩远方、勇敢探索,还是将眼前的琐碎默默打理与守护,MiniCPM都是值得信任的大模型好朋友。

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前


端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前


最后,笔者还想聊一下观察到的面壁智能端侧AI的下一步。


5.面壁小钢炮+机器人,开启具身智能无限可能

大模型与机器人融合的 “具身智能”,是未来十年最令人期待的科技突破之一!

最近,面壁小钢炮 MiniCPM 端侧模型在这方面迈出了关键一步。

一是联手加速进化机器人,打造出完整“具身智能”的先驱方案,业界首个高效端侧模型运行在人形机器人的演示,理解、推理、并与物理世界互动的智能系统,这激动人心的未来场景,已拉开帷幕!

二是联手大象机器人。前些天 MiniCPM 端侧模型将植入大象机器人旗下仿真陪伴宠物机器人 metaCat 米塔猫,高效端侧模型能够显著提升仿真机器宠物“类生命体”的智能交互体验:不依赖网络,不需要复杂的硬件改造,以更自由更自然的交互,让机器萌宠触发声、光、电、动作响应,仿真感更强,情感陪伴更加逼真。

面壁小钢炮 MiniCPM 端侧模型之前在 PC、平板、手机已有实际运行,最近面壁智能与加速进化机器人和大象机器人的合作,让笔者看到了面壁智能从端侧AI+机器人方向切入具身智能的无限可能。触角也伸入智能座舱,面壁联合MTK,为梧桐科技提供了MiniCPM车载多模态大模型,实现舱驾协控相关的功能控制,包括知识查询和人-车-环境感知融合的多模态增强理解模块,成为梧桐科技A I座舱芯算一体的端侧大模型关键合作伙伴!

未来大模型+机器人演化出终极形态,端侧智能无处不在,面壁智能天地广阔。

雷峰网(公众号:雷峰网)

雷峰网版权文章,未经授权禁止转载。详情见转载须知。

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

风台专

更多 >
  • Hinton与姚期智对谈:认为人类的意识特殊,那是危险的无稽之谈
    更新:2025-09-09 13:52
  • 吴建豪,被人羞辱后狠狠扇了一耳光!
    更新:2025-09-09 13:11
  • 俄称击落百架乌无人机 乌方通报遭俄大规模空袭
    更新:2025-09-09 13:02
  • 交通网“疯长”,城市运行稳如“老司机”
    更新:2025-09-09 12:51

热门文章

  • 腾讯Robotics X具身智能开放平台Tairos发布,融合左脑、右脑、小脑
    腾讯Robotics X具身智能开放平台Tairos发布,融合左脑、右脑、小脑

    腾讯Robotics X具身智能开放平台Tairos发布,融合左脑、右脑、小脑

    7月27日,2025世界人工智能大会腾讯论坛期间,腾讯 Robotics X 实验室与福田实验室联合发布具身智能平台Tairos钛螺丝)。雷峰网(公众号:雷峰网)AI科技评论获悉,其由模型算法和云服务 ...

  • 今日辟谣(2025年7月21日)
    今日辟谣(2025年7月21日)

    今日辟谣(2025年7月21日)

    来源: 中国互联网联合辟谣平台2025年7月21日谣 言甘肃兰州一化工仓库附近突发爆炸?真相:近日,某网民在短影片平台发布“兰州市西固区一处化工仓库附近突发爆炸,已启动应急响应”等信息,引发关注。经查 ...

  • 伊朗外长:伊朗没有停止铀浓缩项目
    伊朗外长:伊朗没有停止铀浓缩项目

    伊朗外长:伊朗没有停止铀浓缩项目

    当地时间7月21日,伊朗外交部长阿巴斯·阿拉格齐表示,美国袭击事件后,伊朗浓缩铀相关设施“遭到严重破坏”。他还表示,铀浓缩项目没有停止,伊朗不能放弃,这对伊朗来说非常珍贵,涉及民族自尊心。总台记者 赵 ...

  • 济南莱芜山洪灾害致2死10失联,灾后救援正在进行
    济南莱芜山洪灾害致2死10失联,灾后救援正在进行

    济南莱芜山洪灾害致2死10失联,灾后救援正在进行

    7月22日,据济南莱芜应急局消息,当地遭遇强降雨天气,最大降雨量364毫米,大王庄镇石屋子村、朱家峪村附近发生山洪灾害,冲毁及损坏房屋19套,造成2人死亡、10人失联。大王庄镇一名居民告诉@新京报 记 ...

  • 阻挠推搡昆明台记者采访,涉事人被行政拘留10日
    阻挠推搡昆明台记者采访,涉事人被行政拘留10日

    阻挠推搡昆明台记者采访,涉事人被行政拘留10日

    针对网传“昆明广播电视台记者采访被打受伤”一事,昆明市新闻工作者协会高度重视,第一时间了解核查相关情况,现通报如下。8月18日下午,昆明市民吉先生通过昆明市融媒体中心“8099999”微信公众号后台留 ...

  • 反映新中国成立以来首位气象烈士电影《风云哨兵》,在福建德化九仙山开机
    反映新中国成立以来首位气象烈士电影《风云哨兵》,在福建德化九仙山开机

    反映新中国成立以来首位气象烈士电影《风云哨兵》,在福建德化九仙山开机

    来源标题:反映新中国成立以来首位气象烈士电影《风云哨兵》,在福建德化九仙山开机7月21日上午,生动展现我国高山气象工作者坚守与奉献精神的电影《风云哨兵》,在故事原型地——福建省 ...

  • 十年后《你行!你上!》豆瓣还会是6.7分吗
    十年后《你行!你上!》豆瓣还会是6.7分吗

    十年后《你行!你上!》豆瓣还会是6.7分吗

    来源标题:十年后《你行!你上!》豆瓣还会是6.7分吗以钢琴家郎朗少年成长经历为蓝本,姜文新作《你行!你上!》正式登陆全国院线。图为剧照。上周五,姜文导演暌违七年的新作《你行!你上!》正式登陆全国院线。 ...

  • 全国持社保卡人数达13.9亿人 覆盖98.9%人口
    全国持社保卡人数达13.9亿人 覆盖98.9%人口

    全国持社保卡人数达13.9亿人 覆盖98.9%人口

    记者从人力资源社会保障部的新闻发布会上了解到,截至6月底,全国基本养老、失业、工伤保险参保人数分别为10.71亿人、2.45亿人、3亿人,同比均稳中有增。上半年,三项社会保险基金总收入4.53万亿元、 ...

风事榜

更多 >
  • 1.9亿税收的县城,要花17亿重建?
    1.9亿税收的县城,要花17亿重建?

    来源:中国新闻周刊“村超”回来了。8月23日晚,2025年贵州“村超”全国赛总决赛在榕江县“村超”球场开赛。经过激烈角逐,广东肇庆金利诚峻足球队捧起首届“村超”全国赛总冠军奖杯。很难想象,就在两个月前 ...

  • 20岁离异带娃,39岁被逼隐退,却在53岁封神,他到底干了些什么?
    20岁离异带娃,39岁被逼隐退,却在53岁封神,他到底干了些什么?

    “我希望大家重视的是我的歌,而不是我这个人,”刀郎说。可偏偏,大家热衷的是他这个人。刀郎虽是四川人,但在新疆待了多年。其中“刀郎人”是维吾尔族的一支,长居塔里木盆地边缘。平日里,刀郎坐着班车带着酒,往 ...

  • 乌内部大搜查,G7大使团:“严重关切”
    乌内部大搜查,G7大使团:“严重关切”

    乌媒:乌安全局大规模搜查乌反腐部门威胁其独立性,G7大使团表达“严重关切”据《基辅独立报》、英国路透社21日报道,乌克兰国家安全局当地时间7月21日对乌克兰国家反腐败局进行大规模搜查,指控反腐败局一些 ...

  • 广东惠州一水上乐园发生淹溺事故,1人死亡
    广东惠州一水上乐园发生淹溺事故,1人死亡

    据惠州市应急运营局消息,7月14日12时许,惠州市惠东县巽寮滨海旅游度假区海公园水上乐园惠州好山好水旅游增长有限责任公司惠东分公司)泳池发生一起一般淹溺事故,致1人死亡。根据《国务院办公厅关于加强保障 ...

  • 波兰防长:东部发现的不明物体为俄军用无人机
    波兰防长:东部发现的不明物体为俄军用无人机

    △波兰国防部长科西尼亚克-卡梅什当地时间8月20日下午,波兰国防部长科西尼亚克-卡梅什称,在该国东部卢布林省一处农田坠落并爆炸的不明物体是一架俄罗斯无人机,并且波兰的雷达系统“没有探测到此次领空侵犯行 ...

  • 法新社称其驻加沙记者“濒临饿死”
    法新社称其驻加沙记者“濒临饿死”

    当地时间7月21日,法新社记者工会发布声明,称其在加沙地带的最后一批本地记者正面临“饿死”的危险。声明称,法新社目前在加沙共有10名本地合作记者维持一线报道。由于持续封锁,他们“几乎断粮断水”,甚至已 ...

  • 曾志伟、钟镇涛接连道歉
    曾志伟、钟镇涛接连道歉

    来源:广州日报微信公众号7月21日凌晨,曾志伟在社交平台发声明回应近期争议。声明称,其与个人人士的合影属于公开场合的礼节性互动,不代表对该人士的观点有任何支持或认同。全文如下:作为一名中国人,我始终致 ...

  • 北京长城音乐会上演激情乐章 八旬殷承宗长城脚下奏响《黄河》
    北京长城音乐会上演激情乐章 八旬殷承宗长城脚下奏响《黄河》

    来源标题:北京长城音乐会上演激情乐章 八旬殷承宗长城脚下奏响《黄河》八达岭长城脚下,2025北京长城音乐会精彩上演。 主办方供图在长城的见证下,《保卫黄河》的激昂旋律在巍峨群山间回荡,“风 ...

  • 唐嫣罗晋:很相爱,但选择各自精彩
    唐嫣罗晋:很相爱,但选择各自精彩

    来源:黎兜兜作者丨薇刊编辑部.兔兔来源 | VIKAN薇刊ID:kawa01)唐嫣与罗晋的爱情故事一直被视为娱乐圈的典范,从2016年高调宣布恋情到2020年迎来女儿"小小糖",他们的婚姻始终低调而稳 ...

  • 汪峰卖299元音乐课,曾一天卖出5600套,近10日直播销售额超25万
    汪峰卖299元音乐课,曾一天卖出5600套,近10日直播销售额超25万

    近日,歌手汪峰在社媒发布消息称,联合多名音乐人打造的“未来音乐学院”上线。同时,还上线了售价299元的“汪峰教你学音乐”线上课程,包含30节汪峰亲自讲解的录播课加3节专业音乐老师的直播课。汪峰曾在直播 ...

  • 惠誉下调美国25%行业前景评级至“恶化”
    惠誉下调美国25%行业前景评级至“恶化”

    当地时间7月21日,国际评级机构惠誉称,政策风险给美国信用前景蒙上阴影。惠誉在年中更新中,将美国2025年25%行业的前景展望下调至“恶化”,原因是不确定性增加、经济增长放缓以及预期利率将长期维持在高 ...

  • 球报:小孔塞桑将于今天与尤文图斯签约,合同5年
    球报:小孔塞桑将于今天与尤文图斯签约,合同5年

    来源:直播吧直播吧7月22日讯 葡萄牙《球报》报道,小孔塞桑将于周二与尤文图斯签约。这位22岁的边锋将从度假地阿尔加维直接飞往都灵,等待他的是一份为期五赛季的合同。波尔图将因这笔转会获得3200万欧元 ...

风报事SpaceX“星舰”成功溅落,第十次试飞圆满结束
瓜集刘宇宁2025巡演深圳震撼开唱 宇宙奇点照亮“梦开始的地方”
热料文化新观察|古装剧兴起“考据热”:读懂何以中华的兴趣“入口”
全看外交部:中方愿同欧方共同努力,对外发出积极信号
风谈聚一场金融“维权”官司背后
风报讯受权发布丨住房租赁条例

风汇

更多 >