{label:top}
首页 >> 全瓜> 正文

面壁李大海:行业大模型是历史阶段性产物

来源:全瓜发布时间:2025-09-09 14:57:08
浏览:52797

作者丨孙溥茜

编辑丨陈彩娴

近日,面壁模型在北京市石景山区人民政府、李大历史北京市经济和信息化局、海行北京市科学工艺委员会中关村科技园区运营委员会联合主办的阶段服贸会分论坛——“通用机器智能算力论坛”(A GICF)上,面壁智能发布了千亿多模态大模型露卡 Luca,性产并正式开启了 Luca 2.0 的面壁模型武汉大学爆料体验全民公测。

Luca 寓意地球生命始祖,李大历史The Last Universal Common Ancestor。海行

最在今年5月27日的阶段2023数博会上,Luca1.0首次公开亮相。性产

随后的面壁模型三个月里,Luca迭代了85次,李大历史大语言模型能力整体提升39%。海行其中推理能力提升119%,阶段推理、性产知识、生成等多项能力已媲美 ChatGPT。

这一次的 Luca 2.0 版本除了具有优秀的大语言模型能力外,还具备强大的多模态处理能力。图片理解能力已达中文全网最强。南京高中偷拍地址

其中多模对话、细节描述和复杂推理三项整体得分为92.5分,而行业其他模型的平均得分是78.4分,远超现有支持中文且具备图片理解能力的大模型。

会后李大海接受了媒体群访,针对行业或通用大模型、近来火热的一体机话题、知乎信息集对 Luca 训练的帮助、大模型评测榜单等热点问题表达了自己的看法。

以下是李大海与 AI 科技评论等媒体的对话精选:



1
坚定走向通用大模型之路

Q:目前资本圈和科技圈对大模型的态度冰火两重天,前者冷淡后者火热,请问您正在关注哪些问题?

李大海:现在大家普遍思考大模型如何落地的比较多。我的精力目前主要分配在几个方面:

首先,我们的模型在以专项的形式封闭式开发,封闭式开放效率很高,以至于我们能在三个月的时间里,成功将百亿模型做到今天的千亿模型,这个过程很辛苦。

另一方面是思考到底有哪些应用可以去做,以及看应用如何与大模型结合,这里面就有一个大模型与应用二者关系的问题。

我会认为我们一定要做大模型原生的应用,将应用建立于大模型之上,如果没有大模型,应用就不应该存在。

然而,一些应用在现有场景中已经在使用大模型,尽管在使用过程中可能会带来一些效率提升,但我认为这种不算是典型的大模型应用。

另一方面,我们也不认为大模型原生应用就是100%使用大模型,这样就像拿着锤子找钉子,我们还是要关注客户的真实需求,看这个需求在引入了大模型这一变量后,能否得到更好的满足。

Q:您如何看待 B 端的大模型业务,以及行业大模型增长?

李大海:B 端业务我们在同步开展,但是现阶段我们更侧重 C 端。

过去半年我们看到很多同行被需求追着走,有很多客户非常希望使用大模型。我们有能力解决客户的问题,但是在模型的标准化工作还没有做的特别好的情况下,就需要花费大量的人力填补支持。

我们在思考如何用更高的效率运营 ToB 业务。

其实回归到商业的本质,我们必须关注效率,思考 Profit and Loss 是否是健康。ToB 这件事如果纯做成项目制,其实很难定位,也很难有好看的毛利。

无论怎么做,要想高效交付只有两个选择:或者是面向场景做出相对好的模型,然后模型在场景里面对每一家客户进行微调;或者是做出足够通用的大模型,面对任何场景,只要微调就可以。

我认为未来一定是通用机器智能这个方向。

现阶段行业大模型可以用更小规模的模型承载垂直领域的应用,所以在成本上更有优势。并且通用大模型的能力也没有那么强,但是我相信未来一定会产生既能力强,成本也低的通用模型,这个通用模型会把所有的行业模型的空间抹杀。

行业大模型是现在阶段性的产物,我尊重现在的历史阶段。

Q:面壁大模型从百亿跃升到千亿,与悟道2.0时期从百亿模型进化到千亿量级有何区别?

李大海:从工艺上,我们当时推出的 CPM2 (Chinese Pretrained Model) 千亿模型是一个 MoE 的稀疏模型,和我们现在推的千亿模型不太一样。

我们现在的千亿模型是 Decoder-only 网络结构的千亿模型。

值得一提的是,CPM 大模型是面壁智能从零自主研发的预训练大语言模型,其中包括国内首个中文大模型 CPM-1。

最新的大模型训练实况项目 CPM-Live的第二期百亿模型CPM-Bee是国内首个开源免费商用基座模型,目前已授权给数百家企业合法商用。

Q:面壁发布的千亿多模态大模型是否会作用大语言模型的研究进展?

李大海:这里要说明,我们公司的重点资源是做大语言模型,这是基础,必须先做好,这也是我们的阶段性战略。

而我们的优势在于,我们是一个产学研结合的团队,大语言模型不只在用公司资源在做,而是实验室的同学和公司合作的结果。

大语言模型作为一个基座,把多模态的东西对接进来,对原有的模型没有作用,所以把基座模型做的越来越好,我们才能够更加顺滑地增加不同模态的信息和学习意见。

Q:知乎提供的信息集有哪些优势?

李大海:我们的模型取得非常好的成绩,离不开知乎里大量的高质量图文信息。

知乎是一个社区,很多客户在知乎在上传图片时会给图片精心配上文字,这种 UGC的内容(客户生产内容)比第三方标注平台提供的信息质量要高出很多。



2
开源、独角兽、一体机

Q:您如何看待现在的开源大模型在 ToB 领域的作用?

李大海:目前开源这件事,对于开源厂商主要诉求还在于模型作用力的提升。因为模型开源现在还没有形成像安卓系统一样的生态,比如客户拿自己的信息去训练,信息不会集中到一个中心化的场景,甚至模型好不好用,都没有反馈的声音。

模型作用力的提升对于做 ToB 的业务是有帮助的,但是它的链条比较长,比较间接。

当竞争进行到一定阶段时候,大家的模型都差不多,客户会更关心,支持提供商自己的存续能力有多强,能否保障售后能力。就像电动车制造,一开始所有品牌百花齐放,早期的客户都是尝鲜者,但是一旦大众涌入后,车厂的售后能力、综合能力就会暴露出来。

Q:您认为通用大模型会出在大公司还是创业公司?

李大海:其实参考美国,我们也没有看到说头部公司就是通用大模型的天下,这事并没有发生。

我认为这件事还是要看公司的创新。

这本身还是一个综合的变量。一个公司能否在最新的工艺浪潮中胜出,由很多因素决定,有没有足够好的人、资源、组织能力、创新力度、对创新的容忍度、战略方向等,没有一定之规。

Q:您怎么看待现在流行的一些大模型评测标准 ?

李大海:我认为在大模型领域,榜单就是一个悖论。

一旦出现大家都很认可的榜单,就一定会出现刷榜,这个事很难避免,除非榜单是完全随机的,由大模型随机生成题目,而且权威性得到大家认可。

未来也许可以,现在我觉得还是太早了。

因为大模型背题非常厉害,只要能拿到题目,喂给大模型它很快就能背会。我们现在观察到,大模型一旦能够背会,它就一定不会去理解。

Q:LUCA 现在收到的使用申请大概是什么情况?

李大海:我们正式发布后收到了很多申请,同事们在逐一批准,现在是一个有限的推理量,不太方便透露。但我们会基于支持量,不断提高供给效率。

Q:传闻面壁也即将推出一体机,您对一体机持什么看法?

李大海:一体机这件事只能说我们在和合作伙伴有一些密集的推进,但是进展还不方便透露。

我认为一体机是一个顺应国内 ToB 市场的,特殊国情的产物。

但是为什么会产生一体机,就像我刚才所说,国内一些企业习惯于低估软件价值,高估硬件价值。软硬一体结合更能把产物的价格抬起来。

我个人还是更看好云支持,将繁琐的运维工作丢给云厂,模型厂商才可以更专注模型研发。

欢迎添加作者微信Sunpx33,交个朋友~


雷峰网(公众号:雷峰网)雷峰网


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

面壁李大海:行业大模型是历史阶段性产物

风汇乐

更多 >
  • 开学季来临,学生平安险该怎么买?
    更新:2025-09-09 14:38
  • 人民日报:不少声音呼吁“同志”称呼重归主流
    更新:2025-09-09 14:01
  • 《遮天》短剧正式开播!掌阅科技引领AI与真人实拍融合创作方向
    更新:2025-09-09 13:36
  • 四天六轮谈不拢?加沙停火谈判卡在这三件事
    更新:2025-09-09 12:36

热门文章

  • 专访宗馥莉:我不会因为风波改变方向
    专访宗馥莉:我不会因为风波改变方向

    专访宗馥莉:我不会因为风波改变方向

    来源:财经杂志编辑|杨立赟2025年7月13日,娃哈哈创始人家族的继承之战,被推到聚光灯下。被外界视为宗庆后“独女”的宗馥莉,被三名自称“同父异母的弟妹”在香港和杭州的法院起诉,涉及21亿美元巨额离岸 ...

  • 外交部:美对铜加征关税不符合任何一方利益
    外交部:美对铜加征关税不符合任何一方利益

    外交部:美对铜加征关税不符合任何一方利益

    财联社7月10日电,据央视新闻,当地时间7月9日,特朗普宣布对铜征50%关税。今天,中国外交部发言人毛宁对此表示:这个问题我们立场非常明确,我们一贯反对泛化国家安全概念,我们也始终认为关税战、贸易战没 ...

  • 电影《恋曲尘封》定档6月13日 金牌班底倾力打造老上海故事
    电影《恋曲尘封》定档6月13日 金牌班底倾力打造老上海故事

    电影《恋曲尘封》定档6月13日 金牌班底倾力打造老上海故事

    来源标题: 电影《恋曲尘封》定档6月13日 金牌班底倾力打造老上海故事日前,由吴有音导演/编剧,蒋雯丽、黄轩、黄小蕾、罗辑、林栋甫主演,马思纯特别出演的电影《恋曲尘封》曝光定档海报。该片讲述了少年轩 ...

  • 相声演员杨少华去世,曾登上春晚
    相声演员杨少华去世,曾登上春晚

    相声演员杨少华去世,曾登上春晚

    9日下午,记者从相声演员苗阜、天津知名相声主持人小佀老师处获悉,相声演员杨少华去世,享年94岁。苗阜在个人微博悼念杨少华:一辈子了!走好杨少华,1931年出生于北京,中国内地相声男演员。杨少华早年家庭 ...

  • 女子在麦当劳打骂工作人员,称“认识大把警察”?警方通报
    女子在麦当劳打骂工作人员,称“认识大把警察”?警方通报

    女子在麦当劳打骂工作人员,称“认识大把警察”?警方通报

    8月19日晚,广东惠州一家麦当劳内发生一起争执事件。8月21日,惠州市公安局惠城分局就此事发布警情通报:8月19日20时许,惠州110接群众报警称,在江北街道某餐厅内有一女子闹事。接报后,我局立即出警 ...

  • 古装传奇剧《藏海传》厚重底蕴精良制作引关注 不落爽剧窠臼 淬炼人性光辉
    古装传奇剧《藏海传》厚重底蕴精良制作引关注 不落爽剧窠臼 淬炼人性光辉

    古装传奇剧《藏海传》厚重底蕴精良制作引关注 不落爽剧窠臼 淬炼人性光辉

    来源标题:古装传奇剧《藏海传》厚重底蕴精良制作引关注 不落爽剧窠臼 淬炼人性光辉当古装剧陷入“大女主”与“爽剧”的创作窠臼时,《藏海传》以冷峻的现实主义 ...

  • 2025年电影票房破300亿
    2025年电影票房破300亿

    2025年电影票房破300亿

    来源标题:2025年电影票房破300亿从票房构成来看,年度票房榜前十名影片中,国产电影占据九席。《哪吒之魔童闹海》以超过51%的票房占比持续领跑,《唐探1900》和《封神第二部:战火西岐》分列第二、三 ...

  • 突发!俄罗斯发动大规模攻击
    突发!俄罗斯发动大规模攻击

    突发!俄罗斯发动大规模攻击

    当地时间10日,乌克兰首都基辅持续传出爆炸声。此前基辅拉响防空警报。此前,俄罗斯国防部9日发布战报称,俄军对乌克兰军用机场基础设施进行了集群打击。乌克兰方面同一天称,俄对乌多个城市发动新一轮大规模攻击 ...

乐谈

更多 >
  • 九三阅兵,具体安排来了!
    九三阅兵,具体安排来了!

    国务院新闻办公室8月20日举行新闻发布会,介绍阅兵准备工作有关情况。这张长图,带你了解九三阅兵具体安排。点击进入专题:国新办发布会介绍阅兵准备工作 ...

  • 千年古都的时代华章,《城市风华录》走进文明城市洛阳
    千年古都的时代华章,《城市风华录》走进文明城市洛阳

    来源标题:千年古都的时代华章,《城市风华录》走进文明城市洛阳洛阳,一座拥有5000多年文明史、4000多年建城史和1500年建都史的古都。作为华夏文明的重要发祥地,这里既是丝绸之路的东方起点,也是隋唐 ...

  • 中国商务部出手,它们还说“没影响”?
    中国商务部出手,它们还说“没影响”?

    中国商务部9日宣布将8家台湾地区实体列入出口管制管控名单,禁止向其出口两用物项。老司机仔细查了一下,这些台湾实体几乎覆盖了所有台军自制装备的生产单位,涉及台湾各军种的先进装备。可以说,台军未来装备的研 ...

  • 尹锡悦再被捕,或“牢底坐穿”
    尹锡悦再被捕,或“牢底坐穿”

    韩国首尔中央地方法院10日凌晨签发对前总统尹锡悦的逮捕令。负责调查紧急戒严事件的特检组随后实施逮捕。这是尹锡悦获释4个月后再次被捕。当地时间2025年7月9日,韩国首尔,韩国前总统尹锡悦中)抵达法院, ...

  • 阿里国际AI进展:日均调用量已破10亿次,获 WAIC 2025「SAIL之星」
    阿里国际AI进展:日均调用量已破10亿次,获 WAIC 2025「SAIL之星」

    7月26日,2025世界人工智能大会卓越人工智能引领者SAIL奖公布,阿里国际跨境电商AI解决方案Marco斩获本届SAIL之星,成为该领域的首个获得者。Marco由阿里国际AI Business团队 ...

  • 创业板指涨逾1%,沪指站稳3500点上方
    创业板指涨逾1%,沪指站稳3500点上方

    来源:财联社财联社7月9日电,指数持续走强,创业板指拉升涨逾1%,沪指涨0.35%,深成指涨0.60%。影视传媒、核聚变、机器人、军工等方向涨幅居前,沪深京三市上涨个股近3100只。股市动态:09:3 ...

  • 《少年书院行》:用青春脚步丈量文明厚度
    《少年书院行》:用青春脚步丈量文明厚度

    来源标题:《少年书院行》:用青春脚步丈量文明厚度在文化类节目不断探索年轻化、可视化、沉浸式表达的新语境中,由湖南卫视与芒果TV联合推出的《少年书院行》以鲜活的少年视角与行走式的叙事模式,开辟出一条传统 ...

  • 爱奇艺举办第五届“金豪笔编剧之夜” 62位编剧20部作品获表彰
    爱奇艺举办第五届“金豪笔编剧之夜” 62位编剧20部作品获表彰

    来源标题:爱奇艺举办第五届“金豪笔编剧之夜” 62位编剧20部作品获表彰6月11日,由中国文联电影艺术中心、中国动画学会、中广联合会电视剧编剧委员会指导,爱奇艺主办的第五届“金豪笔编剧之夜 ...

  • 老年人免费乘公交,撑不住了?
    老年人免费乘公交,撑不住了?

    来源:中国新闻周刊近日,吉林省德惠市发布的一则《免费老年卡错峰出行通知》引发了社会关注。该通知提到,因早晚高峰时间段公共交通拥挤,无法保证上学、通勤人群的刚性出行需求,计划自9月1日起对持有免费“老年 ...

  • 《太奶奶》爆火助推李柯以升咖“短剧一姐”,听花岛成大咖制造机
    《太奶奶》爆火助推李柯以升咖“短剧一姐”,听花岛成大咖制造机

    来源标题:《太奶奶》爆火助推李柯以升咖“短剧一姐”,听花岛成大咖制造机作为国内精品短剧第一厂牌,听花岛在6月推出的《十八岁太奶奶驾到,重整家族荣耀》简称《太奶奶》)堪称战略落地的范本,以黑马之姿刷新了 ...

  • 周杰伦入驻抖音取名周同学,平台否认9位数签约费
    周杰伦入驻抖音取名周同学,平台否认9位数签约费

    7月9日,歌手周杰伦正式入驻抖音,开通了他第二个中文社交媒体账号,取名“周同学”,头像是他的玩偶形象。抖音称“花9位数签周杰伦”不属实。 ...

  • 印度一桥梁断裂坍塌 死亡人数升至13人
    印度一桥梁断裂坍塌 死亡人数升至13人

    总台记者当地时间7月10日获悉,印度古吉拉特邦一座桥梁9日发生断裂坍塌,有多辆车坠入河中,目前已造成13人死亡。总台记者 魏可枫) ...

趣爆美联储首次回应特朗普解雇理事库克:将尊重司法裁决
点集今年将举办50多场演唱会 鸟巢放歌引爆双奥场馆新热潮
风风秀国际艺术家共绘中墨友谊壁画 艺术助力北京乡村振兴
点报2025中国国际大学生时装周✕神州租车潮游旅行大赛获奖作品揭晓
风站闻演员李明德已刑满释放,经纪人报平安称一切都好,此前因酒后砸车被判有期徒刑6个月
独谈中国商务部出手,它们还说“没影响”?

瓜点

更多 >