{label:top}
首页 >> 风谈秀> 正文

百川智能发布Baichuan2—Turbo系列API,开启企业定制化新生态

来源:风谈秀发布时间:2025-09-09 08:28:00
浏览:9

【雷峰网(公众号:雷峰网)消息】12月19日,百川百川智能宣布开放基于搜索增强的发布Baichuan2-Turbo系列API,包含Baichuan2-Turbo-192K 及Baichuan2-Turbo。开启在支持192K超长上下文窗口的企业基础上,还增加了搜索增强知识库的定制能力。即日起,化新上海学院爆料下载API客户可上传文本资料来创建自身专属知识库,生态从而根据自身业务需求打造更完整、百川高效的发布智能解决方案。百川智能在引领国内大模型开源生态之后,开启再次引领行业开启了企业定制化的企业新生态。


商业体验官网:https://platform.baichuan-ai.com/playground

 

此外,定制百川智能还升级了官网模型体验,化新目前其官网大模型已支持PDF、生态Word等多种文本上传以及URL网址输入,百川客户可通过官网入口体验搜索增强和长窗口加持后的通用智能。

 

百川大模型官网:https://www.baichuan-ai.com


百川智能认为,搜索增强是大模型落地应用的关键,能够有效解决幻觉、时效性差、专业领域知识不足等阻碍大模型应用的核心问题。一方面,搜索增强工艺能有效提升模型性能,并且使大模型能“外挂硬盘”,实现互联网实时信息+企业完整知识库的杭州师范大学偷拍推荐“全知”;另一方面,搜索增强工艺还能让大模型精准理解客户意图,在互联网和专业/企业知识库海量的文档中找到与客户意图最相关的知识,然后将足够多的知识加载到上下文窗口,借助长窗口模型对搜索结果做进一步的总结和提炼,更充分地发挥上下文窗口能力,帮助模型生成最优结果,从而实现各工艺模块之间的联动,形成一个闭环的强大能力网络。


大模型+搜索构成完整工艺栈,实现了大模型和领域知识、全网知识的全新链接


尽管大模型是划时代的工艺突破,但现阶段大模型并不完美,幻觉、时效性差、缺乏专业领域知识等问题,是其落地千行百业必须要面对的挑战。

 

对此,业界探索了多种解决方案,包括扩大参数规模、扩展上下文窗口长度、为大模型接入外部信息库,使用特定信息训练或微调垂直行业大模型等。这些路线各有优势,但也都存在自身的局限。

 

例如,持续扩大模型参数虽然能够不断提升模型智能,但是需要海量信息和算力的支撑,巨额的成本对中小企业非常不友好,而且完全依靠预训练也很难解决模型的幻觉、时效性等问题。

 

业界亟需找到一条集诸多优势于一体的路径,将大模型的智能切实转化为产业价值。在百川智能的工艺思考中,大模型+搜索增强是大模型时代的新计算机,大模型类似于计算机的CPU,通过预训练将知识内化在模型内部,然后根据客户的Prompt生成结果;上下文窗口可以看做计算机的内存,存储了当下正在处理的文本;互联网实时信息与企业完整知识库共同构成了大模型时代的硬盘。

 

基于这一工艺理念,百川智能以Baichuan2大模型为核心,将搜索增强工艺与大模型深度融合,结合此前推出的超长上下文窗口,构建了一套大模型+搜索增强的完整工艺栈,实现了大模型和领域知识、全网知识的全新链接。


用行业大模型解决企业应用不是最佳方法,大模型+搜索增强可以解决99%企业知识库的定制化需求


企业自有信息/知识库,是企业的核心竞争力。大模型如果不能结合企业自有信息/知识库,对企业没有价值。对此,业界的传统做法是做行业大模型,通过预训练或者微调训练大模型。但是基于特定信息预训练或微调垂直行业大模型需要高密度的工艺人才团队、大量的算力支持,并且每更新一次信息都要重新训练或微调模型,不仅成本高昂、灵活性差,更关键的是不能保证训练的可靠性和应用的稳定性,多次训练后仍会出现问题。此外,大部分企业信息,都是结构化的信息,也不适合SFT,模型无法准确记忆结构化信息,会带来幻觉。

 

为解决传统方法的缺陷,业内探索了长上下文窗口和向量信息库两种较好的路径。在此基础上,百川智能更进一步,不仅将向量信息库升级为搜索增强知识库,极大提升了大模型获取外部知识的能力,并且把搜索增强知识库和超长上下文窗口结合,让模型可以连接全部企业知识库以及全网信息,能够替代绝大部分的企业个性化微调,解决99%企业知识库的定制化需求,不仅为企业节省巨大成本,还能够更好地实现垂直领域知识的沉淀,让专有知识库能够真正成为企业不断增值的资产。

 

百川智能构建的大模型+搜索增强解决方案解决掉幻觉和时效性问题后,有效提升了大模型的可用性,拓展了大模型能够覆盖的领域,例如金融、政务、司法、教育等行业的智能客服、知识问答、合规风控、营销顾问等场景。而搜索增强相比微调,在提升可用性的同时还显著降低了应用成本,让更多中小企业也能够享受到大模型带来的变革,特别是在电商行业可帮助广大店家提升营销效率乃至转化率。此外,这种应用方式还可以帮助提升企业各种场景应用创新的效率,加速大模型在千行百业创造实际价值。


突破搜索增强工艺多个难点,稀疏检索与向量检索并行召回率提升至 95%

虽然搜索增强能够有效解决大模型落地应用的诸多问题,但在工艺层面构建这样一套系统却并不容易,需要深厚的搜索和模型研发经验来发现并解决各个环节的工艺难点与挑战。

 

在大语言模型时代,客户的需求表达不仅口语化、多元化,并且还与上下文强相关,因此客户需求(Prompt)与搜索的对齐成为了大模型获取外部知识过程中最为核心的问题。为了更精准地理解客户意图,百川智能使用自研大语言模型对客户意图理解进行微调,能够将客户连续多轮、口语化的Prompt信息转换为更符合传统搜索引擎理解的关键词或语义结构。

 

此外,百川智能还参考Meta的CoVe(Chain-of-Verification Reduces Hallucination in Large Language Models)工艺,将真实场景的客户复杂问题拆分成多个独立可并行检索的子结构问题,从而让大模型可以针对每个子问题进行定向的知识库搜索,提供更加准确和详尽的答案。同时通过自研的TSF(Think  Step-Further)工艺,百川智能的知识库可以推断出客户输入背后深层的问题,更精准的理解客户的意图,进而引导模型回答出更有价值的答案,为客户提供全面和满意的输出结果。

 

在精确理解客户需求的基础上,想要进一步提升知识获取的效率和准确性,还需要借助向量模型解决客户需求和知识库的语义匹配问题。为实现更好的向量检索效果,百川智能自研的向量模型使用了超过 1.5T token 的高质量中文信息进行预训练,通过自研的损失函数解决了对比学习对于 batchsize 的依赖,在C-MTEB评测集 6 个任务(分类、聚类、文本推理、排序、检索、文本相似度) 中的 5 个任务上都取得了效果的大幅领先,综合分数登上榜首。

百川智能发布Baichuan2—Turbo系列API,开启企业定制化新生态

虽然当下构建大模型知识库的主流方法是向量检索,但是向量模型的效果过于依赖训练信息的覆盖,在训练信息未覆盖的领域泛化能力会有明显折扣,并且客户 prompt 和知识库中文档长度的差距也给向量检索带来了很大挑战。

 

对此,百川智能在向量检索的基础上融合了稀疏检索和 rerank模型。通过稀疏检索与向量检索并行的混合检索方式,将目标文档的召回率提升到了 95%,大幅领先于市面上绝大多数开源向量模型的80%召回率。

 

不仅如此,对于大模型在回答过程中由于引用资料不准确以及与大模型不匹配,导致模型的“幻觉”加重的现象。百川智能还在通用RAG(检索增强生成)的工艺基础上首创了Self-Critique大模型自省工艺,该工艺能够让大模型基于Prompt对检索回来的内容从相关性、可用性等角度进行自省,筛选出最优质、最匹配的候选内容,有效提升材料的知识密度和广度,并降低检索结果中的知识噪声。

5000万tokens信息集测试回答精度95%,长窗口+搜索实现“真·大海捞针”


长上下文窗口虽然可以接收更长的文本信息,但扩展上下文窗口长度会作用模型性能,在当前工艺下存在上限。并且长窗口每次回答问题都要将文档全部重读一遍,推理效率低、成本高。百川智能通过长窗口+搜索增强的方式,在192K长上下文窗口的基础上,将大模型能够获取的原本文本规模提升了两个数量级,达到5000万tokens。通过搜索增强,模型可以先根据客户的Prompt在海量的文档中检索出最相关的内容,再将这些文档与Prompt一起放到长窗口中,有效节省了推理费用和时间成本。

 

“大海捞针”测试(Needle in the Heystack)是由海外知名AI创业者兼开发者 Greg Kamradt 设计的,业内公认最权威的大模型长文本准确度测试方法。

对于192k token以内的请求,百川智能可以实现100%回答精度。

百川智能发布Baichuan2—Turbo系列API,开启企业定制化新生态

而对于192k token以上的文档信息,百川智能结合搜索系统,将测试集上下文长度扩展到 5000w tokens,分别评测了纯向量检索和稀疏检索+向量检索的检索的效果。测试结果显示,稀疏检索+向量检索的方式可以实现95%的回答精度,即使在 5000万tokens的信息集中也可以做到接近全域满分,而单纯的向量检索只能实现 80%的回答精度。

百川智能发布Baichuan2—Turbo系列API,开启企业定制化新生态


本次测试,百川智能使用中文场景,实验配置如下:

• 大海(HayStack):博金大模型挑战赛-金融信息集中的80份长金融文档。

• 针(Needle):2023 年 12 月 16 日,在极客公园创新大会 2024 的现场,王小川进一步分享了大模型的新思考。在王小川看来,大模型带来的新的开发范式下,产物经理的出发点,应该从思考产物市场匹配(PMF),到思考工艺与产物的匹配怎么做,即 TPF(Technology Product Fit,工艺产物匹配)。

• 查询问题:王小川认为大模型时代下,产物经理的出发点是什么?

 

不仅如此,百川智能搜索增强信息库的表现也十分优秀,在博金大模型挑战赛-金融信息集(文档理解部分)、MultiFieldQA-zh和DuReader三个行业主流知识库测试集上的得分均领先GPT-3.5、GPT-4等行业头部模型。

百川智能发布Baichuan2—Turbo系列API,开启企业定制化新生态

据了解,目前多个行业的头部企业已与百川智能达成合作,在深度融合百川智能的长上下文窗口和搜索增强知识库的能力的基础上,对自身业务进行了智能化升级。


雷峰网特约稿件,未经授权禁止转载。详情见转载须知。

百川智能发布Baichuan2—Turbo系列API,开启企业定制化新生态

快速

更多 >
  • 1.9亿税收的县城,要花17亿重建?
    更新:2025-09-09 07:53
  • 什么怪物,让美国得州民主党议员“集体跑路”?
    更新:2025-09-09 07:51
  • 华严寺遭游客刻字?官方回应
    更新:2025-09-09 06:29
  • 夫妻吵架,他一气之下跳河,已确认遇难
    更新:2025-09-09 06:02

热门文章

  • 穿着大肚兜的林雪,惊艳亮相《长安的荔枝》,观众看后惊呼大佬
    穿着大肚兜的林雪,惊艳亮相《长安的荔枝》,观众看后惊呼大佬

    穿着大肚兜的林雪,惊艳亮相《长安的荔枝》,观众看后惊呼大佬

    大鹏新片《长安的荔枝》好评如潮,其中不仅主角演技精彩,配角林雪同样令人眼前一亮。片段中,林雪穿着白肚兜,披着红披风,玩着射箭,出场就是大佬既视感。而在之前,林雪在《功夫》里,给观众的感觉就是小混混一个 ...

  • 孟加拉国将于2026年2月举行大选
    孟加拉国将于2026年2月举行大选

    孟加拉国将于2026年2月举行大选

    △孟加拉国首都达卡资料图)总台记者当地时间8月5日获悉,孟加拉国临时政府首席顾问尤努斯表示,将于2026年2月举行大选。2024年8月,孟加拉国发生全国性抗议活动,要求总理谢赫·哈西娜及其政府辞职;5 ...

  • 改过年龄、当过县委书记,刘生胜被查
    改过年龄、当过县委书记,刘生胜被查

    改过年龄、当过县委书记,刘生胜被查

    来源:中国新闻周刊据陕西省纪委监委8月5日消息:陕西省广播电视局原副局长刘生胜涉嫌严重违纪违法,目前正接受陕西省纪委监委纪律审查和监察调查。刘生胜资料图)刘生胜曾改过年龄。公开简历显示,刘生胜是陕西榆 ...

  • 以色列防长:以军必须在加沙外围保持永久驻军
    以色列防长:以军必须在加沙外围保持永久驻军

    以色列防长:以军必须在加沙外围保持永久驻军

    当地时间8月5日,以色列国防部长卡茨表示,他已经就以色列必须采取的安全和政治措施制定了立场,以确保实现战争目标。卡茨认为,击败加沙地带的哈马斯武装人员,同时为人质返回创造条件,是加沙战争的主要目标,以 ...

  • “高速有人戴恐怖面具惊吓过路车辆”?警方通报
    “高速有人戴恐怖面具惊吓过路车辆”?警方通报

    “高速有人戴恐怖面具惊吓过路车辆”?警方通报

    27日凌晨,杭州高速交警发布警情通报,全文如下:警情通报针对网传“长深高速有人戴恐怖面具惊吓过路车辆”事件,经查,涉事人员系萧山区某校外籍老师Hugo男,42岁)。8月24日16时57分,其搭乘朋友车 ...

  • 国家卫健委:医疗机构门诊命名不得“标新立异”
    国家卫健委:医疗机构门诊命名不得“标新立异”

    国家卫健委:医疗机构门诊命名不得“标新立异”

    针对部分医疗机构使用模糊、笼统或容易混淆的门诊名称,少数医疗机构为吸引患者,利用谐音、形容词等暗示疗效的门诊名称误导患者等情况,国家卫生健康委近日发布了《关于规范医疗机构门诊名称运营工作的通知》,强调 ...

  • 从单亲妈妈到商界大佬,两次被渣后,60岁于小慧活成人间清醒
    从单亲妈妈到商界大佬,两次被渣后,60岁于小慧活成人间清醒

    从单亲妈妈到商界大佬,两次被渣后,60岁于小慧活成人间清醒

    导演谢晋曾经这样评价一位演员:她会活到老演到老,她的气质无人可替代。她家境不是特别好,在家排行老四,被邻居公认为是家里最漂亮的孩子。她18岁高中毕业就考入本溪话剧团成为一名演员,很快她就凭借过硬的业务 ...

  • 深圳启动三级防汛应急响应,全市公园实施闭园管理
    深圳启动三级防汛应急响应,全市公园实施闭园管理

    深圳启动三级防汛应急响应,全市公园实施闭园管理

    据深圳市城市管理和综合执法局消息,深圳市三防指挥部于8月5日4时15分将全市防汛四级应急响应升级为防汛三级应急响应。为保障市民游客安全,根据应急响应要求,全市公园实施闭园管理,公园停车场同步关闭。防汛 ...

新榜

更多 >
  • 资本明牌撑腰?黄杨钿甜争议中复出试探舆论风向
    资本明牌撑腰?黄杨钿甜争议中复出试探舆论风向

    作者 | 十三妹沉寂了近两个月的,突然杀回了公众视野。有网友发现,黄杨钿甜现身横店,为其新剧《冰湖重生》补拍戏份。从现场视频可以发现,黄小姐全程口罩遮面、低头疾行,身边工作人员簇拥护航。大量粉丝围堵片 ...

  • 冒雨抢运物资 总台记者探访北京门头沟最大安置点
    冒雨抢运物资 总台记者探访北京门头沟最大安置点

    8月4日,北京在全市范围升级发布暴雨红色预警信号。此次降雨过程,北京市门头沟区是重点防范区域。当地政府累计发送保障提示短信40万条,并组织工作人员上门入户,确保预警全覆盖、转移无遗漏。目前,龙泉镇京师 ...

  • 冲锋!演习现场“机器狼”射击画面最新披露
    冲锋!演习现场“机器狼”射击画面最新披露

    近期在总台热播的思想解读类融媒体片《攻坚——矢志强军向一流》中披露了最新无人化作战模式可以实现协同作战的无人机“蜂群”和“机器狼群”格外引人注目在去年的第十五届中国航展上“机器狼”首次公开亮相可集群作 ...

  • 前滑翔伞运动员,50岁“落地”,砸4亿征服中产胃
    前滑翔伞运动员,50岁“落地”,砸4亿征服中产胃

    快50岁时开启新事业如何?对于大多数人来说,可能觉得太晚了。不过#王炜建认为,“50岁是创业的好年龄,心无旁骛。”这个身形瘦削的河北汉子可真爱折腾。他有过5次跨行业的创业经历,还曾是一名滑翔伞运动员。 ...

  • 即日起,江苏苏州取消市区范围内新建商品住房2年限售
    即日起,江苏苏州取消市区范围内新建商品住房2年限售

    为进一步满足居民改善性住房需求,即日起,取消苏州市区范围内新建商品住房取得不动产权登记证书满2年方可转让的限制措施有特殊限制转让要求的住房除外)。来源:苏州住建)相关新闻70城最新房价出炉,国家统计局 ...

  • 邮报:亚马尔卷入三角恋传闻,与阿根廷模特夜店亲吻
    邮报:亚马尔卷入三角恋传闻,与阿根廷模特夜店亲吻

    据每日邮报消息:亚马尔最近再次卷入情感绯闻。他被曝在一家俱乐部与24岁的阿根廷模特亲吻。这次传闻的起因是亚马尔在社交媒体上发布了一张照片,脸颊上有个显眼的红色唇印。随后,24岁的歌手尼基-妮可也晒出了 ...

  • 能源领域,十余名官员被查
    能源领域,十余名官员被查

    来源:中国新闻周刊能源领域又有一名官员被查。中央纪委国家监委网站8月4日公布的信息显示,国家管网集团西部管道有限责任公司原党委委员、纪委书记唐伏平涉嫌严重违纪违法,目前正接受中央纪委国家监委驻国家管网 ...

  • 特朗普:若欧盟不履行义务 将对其征收35%的关税
    特朗普:若欧盟不履行义务 将对其征收35%的关税

    来源:财联社财联社8月5日电,据报道,美国总统特朗普表示,如果欧盟不履行义务,将对欧盟征收35%的关税。 第一财经) ...

  • 主播直播死亡轰动法国!死前10天被同事各种爆虐,却被当成节目效果...
    主播直播死亡轰动法国!死前10天被同事各种爆虐,却被当成节目效果...

    防走丢,大家也可以在“事儿君看世界”找到我关注起来,以后不“失联”~8月18日本周一,法国知名主播拉斐尔·格拉文Raphaël Graven,网名Jeanpormanove)在家中死亡,终年46岁,一 ...

  • 媒体:周口医生坠亡,别让网曝滑向网暴
    媒体:周口医生坠亡,别让网曝滑向网暴

    ▲网络暴力,绝对不是解决问题、化解纠纷的方式。图/IC photo救死扶伤的医生,也有迈不过去的“鬼门关”。近日,“周口市第六人民医院妇产科主任邵某某因长期遭受网络暴力跳楼身亡”一事引发广泛关注。8月 ...

  • 前滑翔伞运动员,50岁“落地”,砸4亿征服中产胃
    前滑翔伞运动员,50岁“落地”,砸4亿征服中产胃

    快50岁时开启新事业如何?对于大多数人来说,可能觉得太晚了。不过#王炜建认为,“50岁是创业的好年龄,心无旁骛。”这个身形瘦削的河北汉子可真爱折腾。他有过5次跨行业的创业经历,还曾是一名滑翔伞运动员。 ...

  • 巴西就美国加征关税向世贸组织提出磋商请求
    巴西就美国加征关税向世贸组织提出磋商请求

    总台记者当地时间6日获悉,巴西政府已就美国对该国产品征收的关税措施向世界贸易组织提出磋商请求。美国总统特朗普于7月30日签署行政命令,决定自8月6日起,对巴西大部分输美产品加征50%的关税。不过,巴西 ...

风台看突发!SASI全面开火!
新点贷款贴息政策惠企利民 多家银行快速响应
新瓜巨星背后的女人,状态超顶!
事榜免费学前教育来了!谁受益?多少钱?
全速俄副总理:俄方有向印度出口液化天然气的潜力
风闻台非法收受财物6794万余元 李勇一审被判十四年

风谈点

更多 >