{label:top}
首页 >> 风事看> 正文

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

来源:风事看发布时间:2025-09-09 14:59:05
浏览:13

最近的贾扬AI社区,关于模型规模的清吐钱讨论有些活跃。

一方面,为快此前在大模型开发奉为“圣经”的想赚型Scaling Law,似乎正在褪去光环。底该大该去年大家还在猜测GPT-5的贾扬明星泄露规模“可能会大到想不到”,现在这种讨论几乎绝迹。清吐钱大神Andrej Karpathy,为快则是想赚型在感慨大模型规模正在“倒退”。

另一方面,底该大该近期市场上性能优秀的贾扬小型模型层出不穷,参数规模、清吐钱任务处理、为快反应速度、想赚型保障性能,底该大该各公司在不同方面卷了又卷。

究竟是往大做探索极限,还是北京艺术学院晚自习往小做迎合市场?

这最终汇总成一个问题:在这样模型快速更迭的市场中,要怎么才能把LLM模型的商业价值最大化?

唯快不破的模型业态

最近发起讨论的是X.ai创始成员之一的Toby Pohlen。他认为如果模型以指数级速度改进,那么训练模型的价值也会以指数级速度折旧。这也导致人们需要赶在模型更迭前就迅速采取行动获取商业价值,一旦模型产生更新,上一代模型就基本一文不值了。

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

Toby的这番言论深得老板Elon Musk之心,大笔一挥打了一个“100分”。

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

贾扬清也参与到了这场讨论中来,他用感恩节火鸡做了一个有趣的比喻。他提出,售卖模型就像是感恩节火鸡促销,必须在感恩节前夕抓紧时间售卖,避免在感恩节到来后的贬值。新模型的工艺更新就是一个又一个感恩节,只有销售得更快才能赚到更多的利润。

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

(emmm...如果对火鸡不好了解,换成中秋节前抢月饼的故事大家或许应该容易理解一些?)

评论区也有不少人表达了对此观点的赞同。

有人说只要不断地开发新产物和迭代新模型,就能从中持续获得商业价值。

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

还有人说,模型改进的频率将直接决定模型本身的商业价值。

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

但是,模型的商业价值由什么决定,又该如何实现?

模型增长在走CNN老路吗?

模型必须做小,用起来才顺手。

比起大型模型,小型模型成本低应用便利,更能收获商业市场的青睐。贾扬清就发现,行业趋势在于研发和使用尺寸更小性能强大的模型,人们也更愿意把规模参数在7B-70B之间的中小型模型作为商业使用的选择。

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

作为前大模型时代的亲历者,贾扬清在当下LLM模型市场上嗅到了熟悉的味道,先变大再变小变高效,这和CNN时期的模型增长简直一模一样。

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

贾扬清还对CNN的增长历程做了一个简单的介绍。

首先是2012年,AlexNet开启了模型大小增长的序幕。2014年的VGGNet就是一个规模较大的高性能模型。

到了2015年,模型尺寸开始缩小。GoogleNet 将模型大小从GB降至MB,缩小了100倍,还同时保持了良好的性能。同年面世的SqueezeNet也遵循了追求更小尺寸的趋势。

在此之后,模型增长的重点转移到了维持平衡。比如如 ResNet(2015)、ResNeXT(2016)等模型都保持了一个适中的规模,注重计算效率。

贾扬清还介绍了CNN的一个有趣的应用,Google的MobileNet(2017),占用空间小性能优越,还具有出色的特征嵌入泛化。

最后,贾扬清引用了Ghimire 等人在《高效卷积神经网络和硬件加速调查》里的一张图:

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

他还进一步发问,LLM模型未来会遵循和CNN一样的增长趋势吗?

大型模型的盈利思考

不过贾扬清也补充道,虽然行业趋势是模型小型化,但并不意味着号召大家放弃尺寸更大的模型。

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

但这随之而来的是另一个问题:大型模型的成本会更高。

此前也有人提出质疑,对大型模型支持商的运营成本和营运收益做了简单的计算,每天8张H100显卡运营节点的成本约为1000美元,每天可以提供2600万token的支持,但按Llama 405B每一百万token 3美元的价格,怎么算都是亏本的,无法盈利的大型模型不会被市场抛弃吗?

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

贾扬清表示,哎你说这个我就不困了,我熟我来说:)

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

贾扬清认为,虽然每个请求大约每秒输出30个token,但通过批量处理(同时处理多个请求)可以显著提高总吞吐量,可以达到比单个请求高出10倍或更高的吞吐量。

同时他还指出,每秒大约30个token指的是输出token,大模型对于输入token的处理速度更快,这也增加了处理的总token数,大模型通常对输入和输出分别计费,也正是这个道理。

在后续的另一个回复,贾扬清做了更详细的量化计算:

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

批量输出速度:单并发405b推理通常有每秒30个token的输出速度。合理的并发可以使总吞吐量提高10倍,达到每秒300个token的输出吞吐量。

输入token:输入token也被计费,通常输入token的数量远大于输出token。一个常见的聊天机器人应用可能有2048个输入token和128个输出token。假设输入输出token比率为10:1,那么每秒300个输出token的处理量相当于每秒3000个输入token。

价格:每天总共处理285,120,000个token,按当前Lepton价格每百万token2.8美元计算,收入为798.34美元。

机器成本:以lambda按需价格为基准,每张H100卡每小时3.49美元,8张H100卡一天的成本为670.08美元。

收入798.34美元,成本670.08美元,因此通过整合多种工艺方法,在合理流量下(像Lepton这样的大模型工艺支持商)是可能盈利的。

当然,这只是一个简单的推算,实际的盈利还会受到流量稳定性、计费方式、按需使用GPU的机器成本控制、解码、提示缓存以及其他因素的作用。

但某种程度上说,类似深度学习时代对CNN的不断优化,在大模型时代,也需要工艺人员对于模型进行种种优化,来保证性能提高的同时不断降低成本,这正是贾扬清看好的创业路线。

One  more thing

我们不妨再多讨论一下,对于贾扬清这样的AI Infra创业者,模型大小的潮流变化对他的商业模式有什么作用?

这个问题,要分不同情况分析。

如果模型参数量越大,提供模型支持的门槛越高(参考Llama 405B),其客单价自然也就越大;

另一方面,由于很多小模型实际是在大模型的基础上蒸馏而得到,模型小了,所需的计算资源并没有等幅度减少;

由于较小的模型更容易部署在不同的设备和平台上,这可能会带来应用场景的增加,虽然客单价可能降低,但在需求数量上的增加反而可能使得总收入增加;

对于贾扬清来说,META的开源路线使得贾扬清的支持对象扩大,因此开源对他来说更有利。

看来不管未来模型规模怎么不变化,贾扬清都有机会凭借工艺升级稳坐钓鱼台。这有点像之前的中国股市,不管什么消息,都是“利好茅台”啊。

这恐怕就是贾扬清最近在推特上为什么这么活跃发表看法的原因?你看好贾扬清这种AI Infra的创业路线吗?雷峰网雷峰网(公众号:雷峰网)


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

风台深

更多 >
  • 阻挠推搡昆明台记者采访,涉事人被行政拘留10日
    更新:2025-09-09 14:34
  • 柬国防部指责泰军事攻击侵犯柬主权 泰方暂无回应
    更新:2025-09-09 14:01
  • 安理会召开紧急会议 柬埔寨呼吁和平解决柬泰冲突
    更新:2025-09-09 13:06
  • 关注苏超,泰安籍演员白客在苏州做活动时为苏州队打call
    更新:2025-09-09 12:25

热门文章

  • 经纪人透露:千百惠将安葬在北京
    经纪人透露:千百惠将安葬在北京

    经纪人透露:千百惠将安葬在北京

    [经纪人透露:千百惠将安葬在北京]8月19日,中国台湾歌手千百惠因突发病症救治无效离世,享年62岁。21日,封面新闻记者从千百惠经纪人吕芳处获悉,告别式后,千百惠将安葬在北京。至于是否会举行纪念活动, ...

  • “是李小龙主动追求”,时隔52年,她现身回应李小龙之死
    “是李小龙主动追求”,时隔52年,她现身回应李小龙之死

    “是李小龙主动追求”,时隔52年,她现身回应李小龙之死

    一连八集的TVB新闻资讯节目《真相猜‧情‧寻》,由擅长“寻人寻宝”的方东昇团队主持,自7月21日开播后,引起了内地网友的热议。节目一开始就抛出了重磅案件——李小龙猝死之谜。方东昇团队拆解这个流传超过半 ...

  • 韩法院首度认定尹锡悦发动戒严致精神损失 须支付赔偿
    韩法院首度认定尹锡悦发动戒严致精神损失 须支付赔偿

    韩法院首度认定尹锡悦发动戒严致精神损失 须支付赔偿

    当地时间25日,就104名韩国市民因韩国前总统尹锡悦发动紧急戒严受到精神伤害要求赔偿一案,韩国首尔中央地方法院作出一审判决,法院认定尹锡悦有民事赔偿责任,要求尹锡悦向每一名原告支付10万韩元约合人民币 ...

  • 抖音拿下周杰伦,快手还剩什么“杀手锏”?
    抖音拿下周杰伦,快手还剩什么“杀手锏”?

    抖音拿下周杰伦,快手还剩什么“杀手锏”?

    作者/新摘商业评论 拉面虾7月9日周杰伦入驻抖音,生动地证明了什么叫"你大爷永远是你大爷"。入驻第一天仅仅是注册账号,粉丝数就暴涨七百万。与周杰伦关联的港股公司巨星传奇,更是一日就实现股价翻倍,市值增 ...

  • 特朗普重申:美国将不再批准光伏或风电项目
    特朗普重申:美国将不再批准光伏或风电项目

    特朗普重申:美国将不再批准光伏或风电项目

    来源:财联社财联社8月21日讯编辑 牛占林)当地时间周三,美国总统特朗普表示,他的政府将不会批准光伏或风力发电项目,即便在那些电力供应不足的地区。特朗普当天在Truth Social平台发文称:“我们 ...

  • 县长调研稿件被指抄袭,纪委启动问责程序
    县长调研稿件被指抄袭,纪委启动问责程序

    县长调研稿件被指抄袭,纪委启动问责程序

    来源:红星新闻近日,有网友发现山西忻州市五台县政府网站上,县长7月9日的调研稿件与五台山景区党工委副书记7月5日调研的稿件雷同。记者发现,全文390余字中有320余字重复,引发网友猜测存在抄袭嫌疑。7 ...

  • 土媒:费内巴切有意先租后买道格拉斯
    土媒:费内巴切有意先租后买道格拉斯

    土媒:费内巴切有意先租后买道格拉斯

    来源:实况吧实况吧7月26日讯 土媒Fanatik报道,费内巴切有意先租后买道格拉斯-路易斯。报道称,费内巴切将正式启动引进尤文图斯中场球员道格拉斯-路易斯的转会程序,这位27岁的中场未被主帅图多尔列 ...

  • ReelShort再被业内直指抄袭!听花岛称其“第一抄袭公司”
    ReelShort再被业内直指抄袭!听花岛称其“第一抄袭公司”

    ReelShort再被业内直指抄袭!听花岛称其“第一抄袭公司”

    新腕儿 一线7月25日消息, 继刚刚发出的,关于ReelShort的侵权行为,又在另一家公司上演了。听花岛在其公众号发文,指出听花岛版权短剧 《卖菜大妈竟是皇嫂》《冷面小叔宠嫂无度》被由枫叶互动运营的 ...

风风谈

更多 >
  • 出身“企鹅”的“T4大神”,带领小鹅通闯关港交所
    出身“企鹅”的“T4大神”,带领小鹅通闯关港交所

    每经记者 蔡 鼎 每经编辑 魏文艺8月22日,港交所官网显示,SaaS软件运营服务)解决方案供应商深圳小鹅网络技术有限公司Xiaoe Inc。,以下简称小鹅通,证券简称“XIAOE”)当日向港交所首次 ...

  • 焕彩津城:碧涛映铁虹,丹砂绘年丰
    焕彩津城:碧涛映铁虹,丹砂绘年丰

    中国网天津,渤海之滨的璀璨明珠,将山河壮美与现代气象完美交融。这方水土,既留下了码头号子的奋斗记忆,也展现出创新驱动与高质量发展所描绘的壮美长卷。渤海湾的晨雾尚未散尽,天津港的龙门吊已如钢铁巨兽苏醒, ...

  • 王毅会见巴基斯坦陆军参谋长穆尼尔
    王毅会见巴基斯坦陆军参谋长穆尼尔

    据外交部网站消息,2025年7月24日,中共中央政治局委员、中央外办主任王毅在京会见巴基斯坦陆军参谋长穆尼尔。王毅祝贺穆尼尔荣任巴陆军元帅,表示巴军队是国家利益的坚定捍卫者,也是中巴友好的坚定支持者, ...

  • 马克龙称法国将承认巴勒斯坦国,特朗普表态
    马克龙称法国将承认巴勒斯坦国,特朗普表态

    #特朗普回应马克龙称将承认巴勒斯坦国#【马克龙称法国将承认巴勒斯坦国,特朗普表态】据法新社报道,对于法国总统马克龙宣布法国将承认巴勒斯坦国,美国总统特朗普25日称,这一表态“没有分量”。 马克龙24日 ...

  • Hinton与姚期智对谈:认为人类的意识特殊,那是危险的无稽之谈
    Hinton与姚期智对谈:认为人类的意识特殊,那是危险的无稽之谈

    那个因为腰痛而坐不下的男人,终于还是在WAIC坐下了,对面则是同为图灵奖得主、上海期智研究院院长姚期智先生。Geoffery Hinton给大家带来了几个话题与故事,几乎每一个都是关于人与AI的。第一 ...

  • 百万耳环小花进科班了
    百万耳环小花进科班了

    孩子妈故意模糊演唱权跟原唱,唱是没问题的,很多漏洞可以钻,甚至可以自己重新录一版新的拿出去照样商演演出。不过她这边看情形对自己不利,于是主动退一步装弱,反向踩有点甜,内涵他一肚子阴谋算计。老燕子花心思 ...

  • 县长调研稿件被指抄袭,纪委启动问责程序
    县长调研稿件被指抄袭,纪委启动问责程序

    来源:红星新闻近日,有网友发现山西忻州市五台县政府网站上,县长7月9日的调研稿件与五台山景区党工委副书记7月5日调研的稿件雷同。记者发现,全文390余字中有320余字重复,引发网友猜测存在抄袭嫌疑。7 ...

  • 20多只朱鹮现身陕西汉阴 觅食嬉戏很治愈
    20多只朱鹮现身陕西汉阴 觅食嬉戏很治愈

    近日,陕西省安康市汉阴县县城的月河附近迎来了一群特殊“访客”——20多只朱鹮。这群朱鹮时而在浅滩处低头觅食,时而在河边闲庭信步。它们三五成群,优雅的身姿构成一幅人与自然和谐共生的美丽画卷。总台记者 杨 ...

  • 尊湃侵犯华为海思芯片技术商业秘密案一审判决生效
    尊湃侵犯华为海思芯片技术商业秘密案一审判决生效

    据最高人民检察院微信公众号8月27日消息,最高检指导上海市检察机关办理的尊湃侵犯华为海思芯片技术商业秘密案已于7月28日判决,14名被告人十日内均未提起上诉,目前一审判决已生效。据悉,该案中,被非法获 ...

  • 轻松兼职?小心“被当枪”!
    轻松兼职?小心“被当枪”!

    警惕!未成年人社会经验不足,可能在毫无察觉中,被诱导成为诈骗分子的“传声筒”。你以为的“躺赚”,也许是在给诈骗 “当枪”! ...

  • 江苏2025退休人员养老金调整方案出台
    江苏2025退休人员养老金调整方案出台

    来源:扬子晚报[江苏2025退休人员养老金调整方案出台]经省政府同意并报国家人社部、财政部批准,日前江苏省2025年退休人员基本养老金调整方案正式出台,将惠及全省1158万退休人员。国家对基本养老金调 ...

  • 哈马斯官员:已准备好完成停火谈判 以方试图逃避
    哈马斯官员:已准备好完成停火谈判 以方试图逃避

    当地时间25日,哈马斯高级官员塔希尔·努努表示,哈马斯对于相关斡旋方的努力持绝对积极的态度,但对美国方面的声明感到意外。努努表示,谈判进展顺利,其中各方就停火期间以军撤军方案取得了巨大的共识,美国的声 ...

风闻风绿动算力 超智融合
风谈讯副部级崔保华,受贿数额特别巨大
瓜点你属于我,酋长近端锋凯尔西首次晒出与霉霉恋爱后的甜蜜合照
乐集美股三大指数集体收涨 特斯拉涨超3%
专站近东救济工程处:加沙营养不良儿童数量急剧增加
风报独俄罗斯一客机因客舱失压返航

风点视

更多 >