{label:top}
首页 >> 风集谈> 正文

摘掉 Chat 标签,GPT

来源:风集谈发布时间:2025-09-09 14:57:10
浏览:915

摘掉 Chat 标签,GPTGPT-4 将释放更大生产力

作者丨李梅 黄楠

编辑丨岑峰


今日,多模态大模型 GPT-4 震撼登场!标签

GPT-4 能够接受图像和文本输入,GPT输出文本,摘掉在各项测试和基准上的标签综合娱乐厅醉酒后流出表现已经与人类水平相当。

OpenAI 一次性大放送,GPT发布了 GPT-4 的摘掉工艺报告、system card,标签并提供了 ChatGPT Plus 体验、GPTGPT-4 的摘掉 API waitlist、demo 影片,标签以及用于自动评估 AI 模型性能的GPT OpenAI Eval 框架。

Sam Altman 称,摘掉GPT-4 是标签“我们迄今为止最强大、对齐最好的模型”。

摘掉 Chat 标签,GPT-4 将释放更大生产力


—— 1 ——
对 ChatGPT 的巨大超越


在许多方面,GPT-4 都已经能做到之前 ChatGPT(GPT-3.5)所力不能及的事情。相比 ChatGPT,GPT-4 支持更长的输入,一次可接受 32768 个 token,相当于 50 页纸的内容,长篇学术论文可以直接丢给它去解读了。

摘掉 Chat 标签,GPT-4 将释放更大生产力

图源知乎

GPT-4 跟 GPT-3.5 具有相同的 API 接口和交互界面,但在文本总结和加工能力上,GPT-4 有了明显的提升,这表现提出指令后,模型能更好地遵循指令给出答案。

例如让一篇文章变成一个句子,女房客家教期间被侵犯全集每个单词都以 G 开头,GPT-3.5 还未尝试就放弃了任务,但在 GPT-4 中可以很好地完成:

摘掉 Chat 标签,GPT-4 将释放更大生产力

GPT-3.5

摘掉 Chat 标签,GPT-4 将释放更大生产力

GPT-4

同时,GPT-4 对指令的理解能力更佳:

摘掉 Chat 标签,GPT-4 将释放更大生产力

摘掉 Chat 标签,GPT-4 将释放更大生产力

(图片来源:知乎网友:@连诗路)

此次更新中,GPT-4 最令人惊喜的能力,是它可接受图片输入,并对图片生成说明、分类和分析。比如输入一张有鸡蛋、面粉和牛奶的图片,询问 GPT-4 可以使用这些原材料做什么,得到的结果如下:

摘掉 Chat 标签,GPT-4 将释放更大生产力

GPT-4 可以实现从图片中提取文字信息并输出到 HTML,比如尝试手绘一个笑话网站模型,让 GPT-4 尝试自动生成网站的原型图(程序员嗅到了危险的味道):

摘掉 Chat 标签,GPT-4 将释放更大生产力

手绘的笑话网站模型图

摘掉 Chat 标签,GPT-4 将释放更大生产力

GPT-4 根据手绘生成的笑话网站

对比 ChatGPT,GPT-4 的推理能力也有所超越,下面的结果展示了同一个问题 ChatGPT 和 GPT-4给出的不同答案:

摘掉 Chat 标签,GPT-4 将释放更大生产力

左边为 ChatGPT,右边是 GPT-4

不仅如此,GPT-4 还能基于税务法则,帮助一对夫妻精准地计算出2018年缴纳的税额,并给出详尽的运算规则步骤,以便阅读解释。

摘掉 Chat 标签,GPT-4 将释放更大生产力

据了解,OpenAI 于去年 8 月就已经完成了 GPT-4 的训练,我们与 OpenAI 的差距似乎更大了。


—— 2 ——
与 ChatGPT 相同的工艺路线


在工艺层面,一句话概括,GPT-4 是一个 Transformer 模型,使用公开可用的信息(如互联网信息)和第三方提供商许可的信息进行预训练,预测文本中的下一个 token,然后使用 RLHF(来自人类反馈的强化学习)对模型进行微调。

在一份98页的工艺报告中,OpenAI 报告了 GPT-4 的性能、局限性和保障特性,但并没有公开有关架构(包括模型参数量)、硬件、训练计算、信息集构建、训练方法等内容的更多细节。

OpenAI 声称是“鉴于竞争格局和 GPT-4 等大规模模型的保障性作用”。

关于GPT-4的参数量,此前OpenAI的CEO Sam Altman表示,GPT-4不会比GPT-3高出太多,但大家关于GPT-4拥有极大参数量的猜测仍有很多。

对此,UCL 计算机系教授、上海数字大脑研究院院长汪军认为,大力确实出奇迹,此前 ChatGPT 的语言能力很强,有一定的逻辑推理能力,但它并未真正理解信息里面的内容,它只是在原来的训练信息中、搭料能力很强,因此是具有一定局限性的,在训练里一定要加上它对整个世界的理解。举个简单的例子,以下棋为例,如果你给它所有人类的下棋信息能力,比如说2000分以下所有人的信息,如果模型只模仿人的话,那么它是模仿不出比这2000分更高的智能的。

摘掉 Chat 标签,GPT-4 将释放更大生产力

报告地址:https://cdn.openai.com/papers/gpt-4.pdf

在这份工艺报告中,OpenAI 依然传达了一些关键信息,比如 GPT-4 采用与 GPT-3.5/ChatGPT 完全相同的工艺路线;有一系列的对齐方案来保证 GPT-4 输出的保障性;基于不超过 GPT-4 千分之一的计算量来准确预测 GPT-4 在一定计算规模下的性能,利用小模型的训练性能来预测大模型期望性能这一点,在 OpenAI 看来是一项核心能力,也是一个值得研究的方向。


—— 3 ——
GPT-4 背后的强大阵容


尽管在 GPT-4 的工艺细节方面,OpenAI 仍不够 Open,但这次他们也做了一次大胆的公开—— GPT-4 贡献者名单。

这份名单的最大看头在于,从下面这些详细的组别分类中可以大致看出 OpenAI 的部门组织架构,也足见 GPT-4 背后是一支多么庞大的队伍,从模型训练到评估再到保障部署,每一环都配备了大量的人力。

摘掉 Chat 标签,GPT-4 将释放更大生产力

贡献者名单

这里一共列出了7个组别:

预训练:计算集群规模化、信息、分布式训练基础设施、硬件正确性、优化&架构、训练保姆(Training run babysitting)

长文本:长文本研究、长文本 kernels

视觉:架构研究,计算集群规模化、分布式训练基础设施、硬件正确性、信息、对齐信息、训练保姆、部署&后训练

强化学习&对齐:信息集、信息基础设施、ChatML 格式化、模型保障性、Refusals、底层 RLHF 和 InstructGPT 工作、Flagship training runs、代码能力

评估&分析:OpenAI Evals 库、模型分级评估基础设施、加速预测(Acceleration forecasting)、ChatGPT 评估、能力评估、代码评估、真实世界使用案例评估、污染性调查、指令遵循和API评估、新奇能力发现、视觉评估、经济作用评估、非扩散&国际人道主义法与国家保障的有害行为评估、过度依赖分析、隐私和PII评估、保障和政策评估、OpenAI 对抗性测试、系统卡和更广泛作用分析

部署:界面研究、GPT-4 API 和 ChatML 部署、GPT-4 web 体验、界面基础设施、可靠性工程、信任与保障工程、信任与保障监测和响应、信任与保障政策、部署计算、产物运营

其他:发布博客和论文内容、协作、计算分配支持、协议&税务&定价&资金支持、午餐合作伙伴&产物操作、法律、保障与隐私工程、系统运营与随叫随到支持

另外,OpenAI 也对微软的支持表示了感谢,特别是微软 Azure 为 GPT-4 模型的训练提供了基础架构设计和运营方面的支持,另外还有微软Bing团队和保障团队在保障部署方面的支持。

对于 OpenAI 的追赶者来说,这份名单一定程度上指示了一个方向,值得仔细研究。它对于 AI 领域人才的潜在热门职业方向也有启示,比如模型训练“保姆”、新奇能力发现师、运算规则模型保障师、信息和模型污染调查师等等。


—— 4 ——
开启多模态大模型时代


GPT-4 开启了多模态大模型的时代,遗憾的是,OpenAI 这次并没有公布 GPT-4 在多模态方面的工艺细节。

自然语言是多模态的基础

目前 GPT-4 还只是文本+图像输入、文本输出,可以预测文本+图像不久也将实现。ChatGPT 已经带火了 NLP,GPT-4 想必对于视觉领域的研究者们也是一大机遇,也或许是一次冲击。不过,在多模态大模型中,自然语言仍被认为是核心。UCL 计算机系教授、上海数字大脑研究院院长汪军告诉 AI科技评论,Chat 构建了一个相对清晰的逻辑描述,它或许不是百分百严谨,但已经足够让我们去表达一些非常复杂的逻辑关系。但他认为,这是一个 Free power,也即是说,它可以能把这个问题表述得很清晰、但这是表象,最主要的是 Chat 里面含载的语义关系,当其他多模态来了之后,匹配上相应的语义表达,就可以迁移到其他的模态当中。

知识体系和自动化体系时代

在通过交互界面获取信息这一点上,ChatGPT 已经对客户完成了科普任务。GPT-4 出现后,Chat 将不再是大家关注的重点,GPT-4 能力的跃升正在引发大家思考 GPT 时代的产业变革将怎样发生。在前维卓CTO 张烜看来,ChatGPT 背后的时代变化,是从信息时代 AI 向客户快速提供丰富的信息,到AI直接提供完整的知识体系。ChatGPT 的贡献是提供了一个便捷易用的交互界面,让普通人都能用得起来,功不可没,GPT-4 是在此基础上的再一次飞跃。他认为,除了模型变得更大、更强以外,AI 工艺本身的变化可能不显著,但从应用的角度看,新的时代已经到来。这个新时代便是知识体系和自动化的时代,AI 优化的目标是自动化地输出最终结果和完整的知识体系。

能够适应这种新形势的是以 RPA(Robotic process automation)为代表的自动流程化分发,但是目前的 RPA 起始于20年前,不适用于现在的媒体方式和交互内容,需要在文字、图像和影片化处理上加以改进,才能和 GPT 完美匹配。张烜对 AI科技评论透露,这是 GPT 作用产业的一个关键方式,也将是他接下来的创业方向。

目前,有一部分企业已经提前用上了 GPT-4,其中就包括了 Stripe、摩根士丹利和 Duolingo 等。Stripe 团队列出了50个潜在应用程序来测试 GPT-4,经过审查和测试,当中有15个原型被认为是集成到平台中的有力候选者,包括支持定制、回答有关支持的问题和欺诈检测。

摘掉 Chat 标签,GPT-4 将释放更大生产力

摩根士丹利人员日常工作需要面对一个巨大的内容库,涵盖投资策略、市场研究和评论以及分析师见解等知识内容达到数十万页,并且这些信息大多以 PDF 格式分布在内部网站上,需要顾问浏览大量信息才能找到特定问题的答案,搜索费时费力。为此,从去年开始,摩根士丹利就引入了 GPT-3,利用 GPT 的嵌入和检索功能,释放内部人员在财富运营累积知识上的工作量,GPT-4 发布后,将为面向摩根士丹利内部的聊天机器人提供支持,该计划由摩根士丹利财富运营部门首席分析和信息官 Jeff McMillan 所在团队领导进行,团队项目负责人指出,GPT-4 将能够把所有洞察力解析为一种更有用、可操作的格式。

摘掉 Chat 标签,GPT-4 将释放更大生产力

据 McMillan 介绍,摩根士丹利财富运营在 GPT-4 引入后将分为三个部分进行,第一部分的落脚点在 GPT-4 的“几乎瞬间访问、处理和合成内容的非凡能力”上,即基于互联网大量文本进行训练,并在单词、句子、概念和想法之间建立关系。第二个落脚点在摩根士丹利的智力资本,摩根士丹利创立有一个独特的内部内容存储库,后续将通过 GPT-4 进行处理和解析,并受公司内部控制的约束。最后一部分在公司的人员上,摩根士丹利就 GPT-4 进行了培训,每天有200多名员工查询相关系统并提供反馈,尽可能实现由内部聊天机器人完成全面搜索财富运营内容。McMillan 表示,这项工作还将进一步丰富摩根士丹利顾问与其客户之间的关系,使他们能够更快地帮助更多人。Duolingo 也推出了一种由 GPT-4 提供支持的学习体验 Duolingo Max,新增“Explain My Answer(解释我的答案)”和“Roleplay(角色扮演)”两大功能。

摘掉 Chat 标签,GPT-4 将释放更大生产力

角色扮演

在 Explain My Answer 中,学习者通过在某些练习类型之后点击一个按钮,可以进入与 Duo 的聊天获得答案解释,并要求举例或进一步说明;Roleplay 功能允许学习者与应用程序中的角色进行对话,角色覆盖多个真实场景,包括在巴黎的咖啡馆点咖啡、邀请朋友一起旅行、未来的假期计划等。(公众号:雷峰网(公众号:雷峰网))

参考链接:

https://openai.com/product/gpt-4

https://openai.com/contributions/gpt-4

(公众号:雷峰网)

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

摘掉 Chat 标签,GPT-4 将释放更大生产力

风趣潮

更多 >
  • 流行歌手“霉霉”官宣订婚,特朗普回应
    更新:2025-09-09 14:32
  • 台媒:日企高层向台积电“负荆请罪”
    更新:2025-09-09 14:12
  • 乍得前总理马斯拉被判20年监禁
    更新:2025-09-09 13:40
  • 橙色预警 四川12个县市区发生山洪灾害可能性大
    更新:2025-09-09 13:02

热门文章

  • AI 颠覆的第一个职业是程序员?丨GAIR Live
    AI 颠覆的第一个职业是程序员?丨GAIR Live

    AI 颠覆的第一个职业是程序员?丨GAIR Live

    当 AI 大模型飞速进化,最先被卷入洪流的,不是写作画画或运营,而是程序员。过去几年,从 GitHub Copilot 开始,到 Cursor、Codeium、Claude Code,再到各类 Age ...

  • 欧洲多国紧急呼吁以色列撤回扩大加沙军事行动决定
    欧洲多国紧急呼吁以色列撤回扩大加沙军事行动决定

    欧洲多国紧急呼吁以色列撤回扩大加沙军事行动决定

    当地时间8月10日,英国、丹麦、法国、希腊和斯洛文尼亚在联合国安理会就加沙局势发表联合声明,强烈谴责以色列政府进一步扩大军事行动的决定,并呼吁以色列立即撤回该决定。声明警告,这一计划可能违反国际人道主 ...

  • 被特朗普要求“下课”后,陈立武发声
    被特朗普要求“下课”后,陈立武发声

    被特朗普要求“下课”后,陈立武发声

    澎湃新闻记者 周玲美国总统特朗普要求英特尔CEO陈立武辞职,称其有明显“利益冲突”,这为正在进行艰难转型的英特尔带来新变数。陈立武 资料图当地时间8月7日,陈立武在英特尔官网发表了一封致全体员工的信件 ...

  • 一周五场会,“没人敢缺席,也没人真投入”
    一周五场会,“没人敢缺席,也没人真投入”

    一周五场会,“没人敢缺席,也没人真投入”

    毛丽觉得,过去的几年,工作是靠“熬”过来的——连轴转的大小活动和会议、每天要在App上签到并转发文章,以及制作各类没有创造性的文本材料后,还要面对冗长的汇报审核程序……作为沿海某市一所高校的在编教师, ...

  • 宣布重大收购预案 开普云连续两日“20CM”涨停
    宣布重大收购预案 开普云连续两日“20CM”涨停

    宣布重大收购预案 开普云连续两日“20CM”涨停

    每经记者 吴泽鹏 每经编辑 文 多8月25日,复牌的开普云SH688228,股价94.75元,市值63.97亿元)开盘即涨停。前一天晚间,开普云披露了重大资产购买暨关联交易预案,上市公司计划收购深圳市 ...

  • 车辆投保人配偶驾车出事故,保险公司拒赔?法院判了
    车辆投保人配偶驾车出事故,保险公司拒赔?法院判了

    车辆投保人配偶驾车出事故,保险公司拒赔?法院判了

    为家庭所有财产购买保险申请理赔时保险公司却称只能保投保人自己这是否合理?近日,利川法院审理了一起交通事故保险理赔案对这一问题给出了明确答案2024年1月,吴某驾驶无牌电动三轮车与杨某驾驶的无牌电动两轮 ...

  • 国乒女单包揽横滨冠军赛4强,王楚钦只身进半决赛
    国乒女单包揽横滨冠军赛4强,王楚钦只身进半决赛

    国乒女单包揽横滨冠军赛4强,王楚钦只身进半决赛

    8月10日,WTT横滨冠军赛结束了倒数第二日的争夺。国乒女将强势包揽4强,为中国队提前锁定本站冠军,男队则只有2号种子王楚钦打进半决赛。中国女乒在此前两轮比赛中不失“外战”,在8强中强势占据六个席位。 ...

  • 广东多位市委书记、市长,深入一线大扫除
    广东多位市委书记、市长,深入一线大扫除

    广东多位市委书记、市长,深入一线大扫除

    近期,为筑牢基孔肯雅热群防群控严密防线,广东多地在全市范围内开展爱国卫生运动统一行动,党政领导带头深入基层一线,与群众一起开展环境卫生整治。中山网消息,8月9日,中山市委书记郭文海利用周末时间,到坦洲 ...

乐话

更多 >
  • 北京市发布暴雨黄色预警
    北京市发布暴雨黄色预警

    来源:北京市气象局预计21日下午至夜间,我市部分地区将出现小时雨强50毫米以上或6小时降雨量70毫米以上的强降水,山区及浅山区可能出现山洪、泥石流、滑坡等次生灾害,低洼地区可能出现积水,请注意防范。 ...

  • S104线抢通 甘肃榆中灾毁道路全面恢复通车
    S104线抢通 甘肃榆中灾毁道路全面恢复通车

    据央视新闻消息,8月10日13时30分,经过现场30多台套大型机械设备、近200人连续24小时的抢险作业,甘肃省兰州市榆中县境内的S104线兴隆2号桥成功通车,标志着此次兰州榆中强降雨导致的所有灾毁道 ...

  • 大瓜!前女友实名举报:徐杰多次致人打胎,涉赌金额几百万
    大瓜!前女友实名举报:徐杰多次致人打胎,涉赌金额几百万

    8月9日晚,一位自称是徐杰前女友的网友在社交媒体上爆料,称徐杰不仅私生活混乱,还涉嫌赌博。目前,原贴已经无法显示。这位名叫“FreeFree_被耍版”的网友在社交媒体上发布的动态显示,徐杰在2020年 ...

  • 台媒:日企高层向台积电“负荆请罪”
    台媒:日企高层向台积电“负荆请罪”

    来源:参考消息#台媒曝日企高层向台积电请罪#【台媒:日企高层向台积电“负荆请罪”】据台湾东森新闻网8月9日报道,台积电发生“内鬼”外泄2纳米制程工艺事件,机密流向日本关键设备制造商东京电子公司。事件发 ...

  • 前经纪公司称千百惠葬礼拟于周六举行!5月不慎摔跤伤势严重
    前经纪公司称千百惠葬礼拟于周六举行!5月不慎摔跤伤势严重

    著名歌手千百惠于8月19日凌晨因病离世,享年62岁。20日,千百惠前经纪公司工作人员袁先生向南都N视频记者透露,千百惠19日凌晨因病在北京离世,其亲属计划于23日为其举行葬礼,“惠姐非常善良,希望大家 ...

  • 脱口秀从“好笑”变“好哭”,观众不敢笑了?
    脱口秀从“好笑”变“好哭”,观众不敢笑了?

    今年的脱口秀有点猛。让山航为空姐提供裤装,为柳岩7年前的遭遇发声,逼得李诞关评。但另一边又有不少人说今年的脱口秀好哭不好笑。他们怀念以前单纯好笑的时候。脱口秀,好哭不好笑今年脱口秀实火。一边是各种段子 ...

  • 韩右翼团体示威时涉嫌辱华,韩警方立案调查
    韩右翼团体示威时涉嫌辱华,韩警方立案调查

    来源:观察者网韩联社8月10日报道,近期,有社会团体在中国驻韩大使馆附近示威时侮辱中方,韩国警方已对此展开立案调查。据报道,首尔南大门警察署近日传唤支持韩国前总统尹锡悦的右翼团体“自由大学”相关人员于 ...

  • 俄罗斯萨拉托夫州一企业遭无人机袭击
    俄罗斯萨拉托夫州一企业遭无人机袭击

    总台记者10日获悉,俄罗斯萨拉托夫州州长布萨尔金通报称,当地一家工业企业10日凌晨遭到无人机袭击,紧急救援部门正在现场开展工作。乌克兰媒体称,萨拉托夫州一家石油加工企业被无人机击中后发生火灾。总台记者 ...

  • 俄副总理:俄方有向印度出口液化天然气的潜力
    俄副总理:俄方有向印度出口液化天然气的潜力

    当地时间8月20日,总台记者获悉, 俄罗斯第一副总理曼图罗夫在俄印政府间委员会会议上表示,俄罗斯持续向印度供应石油、煤炭及石油产物,并看到俄罗斯液化天然气的出口潜力。曼图罗夫指出,除直接供应外,双方还 ...

  • 人民日报:绝不能任由网暴者肆意横行
    人民日报:绝不能任由网暴者肆意横行

    近日,河南周口一名妇产科医生疑因不堪网暴长期侵扰坠楼身亡。家属接受采访称,网暴源于三起医疗纠纷。目前,当地相关部门已成立调查组。相关医疗纠纷责任划分有待进一步查清,相信有关部门会给出明确的结论。从家属 ...

  • 土耳其地震已致10余栋建筑倒塌 2人被困
    土耳其地震已致10余栋建筑倒塌 2人被困

    当地时间8月10日,土耳其灾害与应急运营中心发布消息称,当天19时53分,土耳其巴勒克埃希尔省森德尔格地区发生6.1级地震,震源深度11公里。森德尔格市市长塞尔坎·萨克表示,地震已导致10余栋建筑倒塌 ...

  • 被特朗普要求“下课”后,陈立武发声
    被特朗普要求“下课”后,陈立武发声

    澎湃新闻记者 周玲美国总统特朗普要求英特尔CEO陈立武辞职,称其有明显“利益冲突”,这为正在进行艰难转型的英特尔带来新变数。陈立武 资料图当地时间8月7日,陈立武在英特尔官网发表了一封致全体员工的信件 ...

风事秀外交部:敦促新西兰有关部门停止散布谎言制造矛盾
风风集车辆投保人配偶驾车出事故,保险公司拒赔?法院判了
风点趣“津”彩跃动,彰显“何以中国”深厚底气
风趣榜美国大使狠批英国首相,“猛烈程度罕见”
事汇中国“人工智能+”行动“路线图”来了
风谈榜张本谈王皓:每次我赢球他都不好好握手,我输球他握手就很自信

休闲

更多 >