{label:top}
首页 >> 快话> 正文

大模型落地,向量信息库能做什么?

来源:快话发布时间:2025-09-09 14:40:27
浏览:82

大模型落地,大模地向量信息库能做什么?型落息库

在保险行业这个海量信息的“聚居地”上,信息库应用已久。量信

近年来,大模地保司信息化转型提速,型落息库各类文本、量信护士酒店开房高清视频音影片的大模地凭证票证核保及跑批需求不断增加,许多机构便将信息库引入至业务流程中。型落息库

但是量信,随着信息库深入保司业务,大模地一个真实的型落息库情况是:传统信息库只能处理机器容易处理的、如字符串等结构化信息,量信以点查和范围查找的大模地形式进行匹配,但面对许多长尾场景下格式繁复、型落息库无法统一处理的量信非结构化信息时,则无能为力,只能继续投入大量人力,进行手动的信息录入和人工检验。

一位从业人员告诉 AI 科技评论,目前在保险公司内人为处理的事情居多,其业务内容中人为比例可达到 90% ,AI 只支持 10% 的信息存取、信息流转。

受工艺瓶颈的掣肘,没有一套通用的方法论得以解决传统信息库的存储、检索和分析难题。信息局限的桎梏不仅发生在保险公司里,各行各业均受其困扰已久。直至大模型+向量信息库的出现。

数月来,大模型风口正盛,向量信息库可以为大模型解决信息更新、知识图谱构建、消除幻觉等问题,使其在短短时间内,一跃成为最受关注的领域之一。向量信息库类产物数量激增,当中既有创业公司,大厂更是战局中主要的竞争对手。

今年 7 月,菲律宾移民妻子整套流出腾讯云发布了 AI 原生向量信息库 Tencent Cloud VectorDB,该产物在 11 月 1 日正式全量开放公测,同时在性能上也实现了大幅提升。

向量信息库之于大模型,是实现降本增效关键的基础设施。信息显示,企业在使用向量信息库后,可实现 80% 非结构化信息能力的覆盖。

大模型的角斗场上,一个行业共识是,谁能够更好地利用信息,把信息沉淀到工程化中里,更快让信息接入到大模型和整个 AI 体系之中,谁就有可能走在最前列。而选择一个对的支持伙伴,至关关键。


大模型的“信息”局限

众所周知,信息在 MaaS 时代很关键,市场的火热映射到具体的企业行为上,表现为大批量垂直模型的推出、信息库企业融资数量增加、信息库使用量陡然增长等。

但在企业落地的过程中,大模型所面临的难题依旧没有解决。

经过近半年的观察,信息局限对企业做大模型带来的作用,可归结为以下三点:

首先是对信息的运营和运维。如上所述,随着文本、图片、影片等多模态的、非结构化信息的使用需求增加,许多企业所产出的非结构化信息量级可高达 80%,如果选择以预训练的方式将信息“喂”给模型,与之而来的则是难以承载的高成本。

身为明星创业公司的百川智能,在模型训练和调试时就曾遇见过类似问题。

未使用向量信息库之前,百川智能一直使用的是开源方案,比如以向量索引为内核,相当于在训练时给模型准备一个 library 级别或运算规则级别的知识库,这些知识库使用简单,采用分布式系统的方式,具有扩展性。但其缺点也很直观,随着数量增长到一定规模时,这种分布式存储的方式会很快遇到瓶颈。

不仅如此,由于市面上缺少成熟的运营工具,信息格式该怎么组织、信息的更新频率如何安排、新旧信息的更迭等等,百川智能都需要额外交给工程师去做,大大增加了人员成本。

第二点,虽然大模型支持的 token 数量在持续增加,具备了“短暂记忆”的能力,但“一本正经地胡说八道”的问题仍无法解决,当中不乏有敏感内容的出现,稍不注意,便可能带来严重的作用。因此,支撑模型训练的信息不仅要数量多,质量也必须足够高。

比如大模型和教育行业的结合,虽然模型可以完成一定的推理和解题,但进入实际应用中,好未来就发现了,大模型在面对数学问题时,其表现仍然不够好。要想解决这个问题,必须基于庞大的、高质量的信息库,像教程题库、数学错题集等,在此之上尝试启发式内容生成。

第三,如何保障企业信息的保障性,信息在空间和时间上会有很大的限制。

一方面,企业很难把自己具有核心竞争力的信息放到大模型中去训练;有行业人士就曾向 AI 科技评论指出,许多应用型公司并不愿意将自身微调的模型贡献到公有版本里、与其他人分享,而是倾向于训练自己的大模型,而后进行本地私有化部署。这个过程中,企业要解决的主要难点是,如何将私有化业务信息跟大模型结合。

销售易是很早就在智能 CRM 业务中引入了大模型,例如提供相似客户推荐、做问答机器人等支持。但客户在使用过程时却发现,大模型所推荐的客户类型经常会出现匹配度不高的情况,向它提问与企业相关的的系统功能问题时,大模型也回答不出来。

另一方面,企业的业务信息变化速度快,且实时性强,因此私有化部署后的大模型、在信息层上也很难做到秒、天级别的更新。

当上述诸多问题横亘于企业和大模型落地之间,学术界和工业界也提出了两种解决方案。

一是采用 Fine-tuning 的方式迭代演进,让大模型学到更多的知识;二是通过 Vector search 的方法,把最新的私域知识存在向量信息库中,需要时在向量信息库中做基于语义的向量检索,这两种方法都可以为大模型提供更加精准的答案。

但是从成本方面来看,行业人士指出,向量信息库的成本仅为 Fine-tuning 的千分之一。向量信息库通过把信息向量化,进行存储和查询可以有效解决大模型预训练成本高、没有“长期记忆”、幻觉、知识更新不及时等问题。

因此,凭借其优势,向量信息库也被视为了加速大模型落地行业场景的关键突破口。


向量信息库的大模型之路

自大模型火爆以来,原已沉寂多年的向量信息库再次受到企业和资本市场的高度关注,据公开信息显示,2023 年 4 月以来,以向量信息库为代表的 AI 投资领域呈增长趋势,包括 Pinecone、Chroma 和 Weviate 等多家向量信息库初创企业均拿到了上亿级美元融资。

为了最大程度上帮助企业应对信息局限问题,更好地将大模型能力释放到行业和产业中,腾讯云走在国内云厂商前列,于今年 7 月便正式上线了向量信息库 Tencent Cloud VectorDB,并在 11 月 1 日全量开放公测。

这也体现了腾讯云在大模型时代下的视角:大模型工艺的创新只是第一步,如向量信息库这类信息存储、检索、分析等基础设施的搭建也同等关键,腾讯不仅提供直接的大模型支持,更关键的是向企业递“铲子”、提供有效趁手的平台工具。

市面上不缺乏好用的向量信息库,那么,腾讯云相比于其他厂商的产物有什么不一样的地方呢?

首先在架构上,腾讯云就采用了 AI 原生的开发架构,从接入层、计算层、存储层提供给全面 AI 化的解决方案,形成一套完整的端到端、一站式支持工艺栈,让不同阶段、不同需求的客户,都能在腾讯云向量信息库里找到对应可用的 AI 能力。

大模型落地,向量信息库能做什么?

腾讯云全面 AI 化解决方案

比如在接入层上,腾讯云向量信息库支持自然语言文本的信息,采用“标量+向量”的查询方式,可支持全内存索引;计算层,AI 原生的开发范式能实现全量信息 AI 计算,一站解决企业搭建私域知识库时信息切分等难题。

这些能力不仅可以让交互更自然,同时在计算结果、效率、成本等方面,也能得到进一步的优化。

在百川智能的工程师们看来,向量信息库带来最直观的改变是,信息分片、导入导出等工作效率得到了极大的提升。面对每天约 2 亿的信息量,以往使用的单线程序处理速度有限,但加入了向量信息库后,加上百川智能所使用的RAG 框架,可以有效解决私有信息、实时信息,同时在信息齐备的情况下,还能消除部分由信息带来的幻觉问题。

信息显示,将腾讯云向量信息库用于大模型预训练信息的分类、去重和清洗,相比传统方式可以实现 10 倍效率的提升,如果将向量信息库作为外部知识库用于模型推理,则可以将成本降低 2 - 4 个数量级。

以前企业将现有信息接入一个大模型需要花 1 个月左右时间,使用腾讯云向量信息库后,最短 3 天时间即可完成,极大降低了企业的接入成本。

第二是集成了 Embedding 功能,企业客户无需关注向量生成过程,使用起来更简单。

大模型落地,向量信息库能做什么?

腾讯云向量信息库 AI 套件

与腾讯云合作以前,好未来曾使用过一些小型的基于内存的向量信息库,虽然也具备了语义结合的能力,但无论是产物的性能还是维护等方面,使用效果不佳。

而在腾讯云向量信息库上,通过语音召回加语义 Embedding 功能,这种采用语义结合进行检索的方式,让模型能力得到了提升,召回内容更多、内容更精准、召回速度更快等等,从而提供更好的客户体验。

例如同样是搜索题库中的“第一单元”,文本召回必须准确地提供“第一单元”这一提示词,但借助向量信息库的相似性检索,语义检索就可以将“Unit1”等近似语义的内容也进行召回。

第三,自研分布式向量信息库核心引擎,支持更稳定可靠、高可用。

AI 科技评论了解到,腾讯云向量信息库所用的核心引擎,是其 2019 年于内部上线使用的 Olama,经过 4 年的探索和迭代,Olama 实现了大规模升级,包括集成了腾讯在内的业界优秀的向量运算规则、降低 Olama 成本、提升稳定性等等,从而更好地适配大语言模型应用。

截至今年 7 月份,Olama 已覆盖腾讯 30 多个业务、100 多个场景,日均调用量超过 1200 亿,调用成功率为 100%,搜索成功率为 99.995%。

可以看到,面对企业在大模型落地中的普遍难题,腾讯云向量信息库力图在每个环节提供便捷、有效的解决方案,突破信息的局限,加速大模型+向量信息库的使用,以解决企业实实在在的痛点和难题。


应用是风口

受限于研发成本和开发难度,过去十年,全球仅有 1% 开发者专注于 AI 领域的研发工作。而到了今天,以大模型为能力基座,一个 AI 应用开发的难度缩短至只需两三个工程师、一个周末时间变成完成。

其中,向量信息库也从以搜索、广告、推荐为主要支持领域,随着 AI 的大规模增长,开始深入千行百业中去,与 C 端客户链接也更加紧密。

举一个销售易与腾讯云的合作案例。

作为一家企业级 CRM 支持商,每天有数万次客户问答在智能客户场景中发生。在以前,传统的 NLP 客服机器人智能做一问一答,这种基于分词语法关键字的检索方式,容易出现搜索答案不精准的情况,客户使用感不佳,慢慢地也失去了提问的积极性。

比如客户希望在业务分析中检索调用出多个信息报表,想要在成千上万个报表中找到指定信息,对模型的信息抽取能力有很高的需求,直接关系到业务的分析效率。

但在同腾讯云合作后,销售易可以先将报表以 Embedding 的形式存入自有向量信息库中,当客户端发生自然语言问询时,这个客服机器人就可以智能化分析问询者的意图,并在向量信息库内去检索相关的知识文档,从而得出一个更接近于人的思考方式的回答。

这样的客服机器人不仅可以支持多轮对话,更关键的是,它还支持了检索模糊的相关性,不需要维护大量同义词、词典或是相似的问法,类似相关性的语言可以交给大模型+向量信息库来解决。

而在潜在客户推荐的场景中,腾讯云向量信息库带来的作用也十分明显。

过去,销售易主要是依据客户的特征字段,在结构化信息里检索有相关特征的企业信息,这种检索对于内部的销售人员要求很高,必须准确地检索近上百个字段,如企业介绍等描述性内容很难被检测,久而久之,员工经常会出现关键字匹配度不高等问题。

而使用了向量信息库后,基于相关性的特征来检索是从文本进行描述,当销售人员想要检索某个行业、某种产物或是某种业务需求的客户时,可以借助文本进行自然语言模糊的相关性检索,使用简单,检索的结果也更真实、准确,智能化效果明显,大幅提升了员工从事客户推荐业务的难度。

大模型落地,向量信息库能做什么?

腾讯云超级底座

可以看到,向量信息库之于大模型应用落地、之于 AI 工艺增长的意义已经逐渐显现。

腾讯云信息库副总经理罗云就曾指出,信息、向量信息库、大模型三者怎么能更好地支持全行业是首要问题,“只有向量信息库变得更 AI 化,信息、向量信息库、大模型三者才能形成一个飞轮效应,彼此之间相互拉动,相互促进,这是我们对向量信息库未来增长的判断。”

这也是腾讯云在当下推出向量信息库 Tencent Cloud VectorDB 的原因所在。

信息显示,自 7 月份正式发布以来,腾讯云向量信息库的日请求量达 1600 亿次,支持腾讯集团内部 40 多个业务,外部客户数更多达数百家,其中就包括了上述提到的百川智能、好未来、销售易,帮助教育、SaaS、工具、游戏等多行业客户快速进行 AI 方向的探索。

大模型进一步推动了对向量信息库的需求。业界共识是,所有产物应用都值得用 AI 重做一次,在这个背景下,企业将会越来越重视如何将其跟 AI、大模型的能力结合起来。而腾讯云向量信息库在提出之时,就已经看到了企业在应用落地中的痛点,用向量信息库在工艺“大脑”中构建起一个健康、且旺盛的“海马体”,为企业迈进大模型时代提供坚实的基座。


这次 Tecno Day 工艺开放日将资料和课件都整合成了一份《腾讯云工具指南》,这份资料工艺含量很高,可以帮助学习了解向量信息库的工艺优势和价值应用。

资料包含信息库的增长趋势和产物价值解读,还有实打实的向量信息库应用案例和解决方案,感兴趣的小伙伴,建议不要错过这个福利!

大模型落地,向量信息库能做什么?

此外,腾讯云向量信息库x百川智能【AGI启航计】正式启动,向量信息库免费实例+ Baichuan2400万免费Tokens限量领取,帮助您快速搭建RAG应用,通过“原文链接”即可获取,Chat With Your Data!

(原文链接:https://cloud.tencent.com/act/pro/agi)

(雷峰网雷峰网(公众号:雷峰网))

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

大模型落地,向量信息库能做什么?

新闻

更多 >
  • 流行歌手“霉霉”官宣订婚,特朗普回应
    更新:2025-09-09 14:32
  • 纪录片《诗美成都》:一场美好的心灵之旅
    更新:2025-09-09 14:31
  • 面对美国关税压力,全球药企加码中国
    更新:2025-09-09 14:16
  • 国家新闻出版署:7月共7款进口游戏获批
    更新:2025-09-09 13:35

热门文章

  • 阻挠推搡昆明台记者采访,涉事人被行政拘留10日
    阻挠推搡昆明台记者采访,涉事人被行政拘留10日

    阻挠推搡昆明台记者采访,涉事人被行政拘留10日

    针对网传“昆明广播电视台记者采访被打受伤”一事,昆明市新闻工作者协会高度重视,第一时间了解核查相关情况,现通报如下。8月18日下午,昆明市民吉先生通过昆明市融媒体中心“8099999”微信公众号后台留 ...

  • 星二代的“世袭困境”:为什么黄奕反对女儿闯韩娱?
    星二代的“世袭困境”:为什么黄奕反对女儿闯韩娱?

    星二代的“世袭困境”:为什么黄奕反对女儿闯韩娱?

    刷到一条视频,是黄奕的闺女和黄奕说,想去韩国出道。黄奕反问,韩国出道?不是每个职业都有一万小时定律,有很多人花了几万小时练习,但就是没成功啊。闺女也反问亲妈:暂且不说母女俩确实颜值有壁,只说一件事,那 ...

  • C罗女友乔治娜晒旅行照,穿搭造型超4万欧元
    C罗女友乔治娜晒旅行照,穿搭造型超4万欧元

    C罗女友乔治娜晒旅行照,穿搭造型超4万欧元

    北京时间7月23日,C罗伴侣乔治娜在个人社媒分享了自己和孩子在葡萄牙旅行游玩的照片。不过相比较于背景中的法蒂玛圣殿,乔治娜奢华的穿搭更是吸引了众人的关注。乔治娜此次身穿奥斯卡-德拉伦塔品牌的蓝红双色不 ...

  • 廉政题材话剧《于成龙》晋京演出
    廉政题材话剧《于成龙》晋京演出

    廉政题材话剧《于成龙》晋京演出

    来源标题:廉政题材话剧《于成龙》晋京演出由山西省话剧院排演的廉政题材话剧《于成龙》7月21日晚在北京保利剧院上演。该剧以清代山西籍名臣于成龙为原型,塑造了一个清正廉洁、心系百姓疾苦的廉吏形象。剧照由山 ...

  • 独家丨前阿里通义视觉负责人薄列峰,已加入腾讯混元团队
    独家丨前阿里通义视觉负责人薄列峰,已加入腾讯混元团队

    独家丨前阿里通义视觉负责人薄列峰,已加入腾讯混元团队

    AI 科技评论独家获悉,原通义实验室应用视觉团队负责人薄列峰已加入腾讯混元大模型团队,直接向腾讯副总裁兼混元项目负责人蒋杰汇报。据悉,薄列峰在今年 4 月 30 日从阿里离任,彼时曾有传闻称他已加盟某 ...

  • 她是“最干净”的女演员,因七次拒绝导演要求被封杀,如今凭实力走红
    她是“最干净”的女演员,因七次拒绝导演要求被封杀,如今凭实力走红

    她是“最干净”的女演员,因七次拒绝导演要求被封杀,如今凭实力走红

    来源:黎兜兜来源 | 乐活记ID | lokwooo在浮华喧嚣的娱乐圈,万茜是一个独特的存在。01她曾因七次拒绝导演的潜规则要求而遭遇封杀,一度无戏可拍,却始终坚守底线。如今,她凭借过硬的演技和坚韧的 ...

  • 广州:上半年出口汽车9万辆,同比增加28.4%
    广州:上半年出口汽车9万辆,同比增加28.4%

    广州:上半年出口汽车9万辆,同比增加28.4%

    7月23日,广州海关举行上半年广州市进出口情况新闻发布会。广州海关统计分析处处长管昆明表示,广州市作为全国重要的汽车生产基地,今年以来汽车产业活力持续释放,出口量显著提升,上半年出口9万辆,同比增加2 ...

  • 广州:上半年出口汽车9万辆,同比增加28.4%
    广州:上半年出口汽车9万辆,同比增加28.4%

    广州:上半年出口汽车9万辆,同比增加28.4%

    7月23日,广州海关举行上半年广州市进出口情况新闻发布会。广州海关统计分析处处长管昆明表示,广州市作为全国重要的汽车生产基地,今年以来汽车产业活力持续释放,出口量显著提升,上半年出口9万辆,同比增加2 ...

专汇

更多 >
  • 近29亿元营收,43倍增长!股价直逼茅台的寒武纪业绩高增速能否持续?
    近29亿元营收,43倍增长!股价直逼茅台的寒武纪业绩高增速能否持续?

    2025年上半年,寒武纪营收28.81亿元,同比增长43倍,实现净利润10.38亿元,成功扭亏为盈,现金流也显著改善。公司归因于人工智能算力需求增长及与前沿领域企业的技术合作。同时,寒武纪计划募资不超 ...

  • “特朗普可能缓和对华关系,印度不安”
    “特朗普可能缓和对华关系,印度不安”

    [文/观察者网 柳白]多年波折后,中印关系迎来改善契机。另一边,美国总统特朗普对印巴事务的种种动作,引发印度不悦。英国路透社7月21日报道指出,美印曾因制衡中国的共同目标而关系升温,如今情况却不同了。 ...

  • 俄乌第三轮直接谈判结束 双方同意新一轮换俘
    俄乌第三轮直接谈判结束 双方同意新一轮换俘

    当地时间23日,俄总统助理梅津斯基在俄乌第三轮直接谈判结束后表示,俄乌目前正在交换双方各250名俘虏,这是第二轮谈判达成的最后一批。俄罗斯一共向乌克兰交还了7000余具遗体,如果乌克兰方面有足够的冷冻 ...

  • 特朗普指控奥巴马“叛国”   奥巴马方回怼其“转移视线”
    特朗普指控奥巴马“叛国” 奥巴马方回怼其“转移视线”

    新华社华盛顿7月22日电记者熊茂伶)美国总统特朗普22日会见媒体时指控民主党籍前总统奥巴马犯“叛国罪”,称其试图“窃取选举”。奥巴马发言人随即予以驳斥,称这是“转移视线的拙劣伎俩”。特朗普当天在白宫椭 ...

  • 美大豆协会呼吁尽早同中国达成协议缓解豆农危机
    美大豆协会呼吁尽早同中国达成协议缓解豆农危机

    美国大豆协会主席凯莱布·拉格兰19日致信美国总统特朗普表示,美国大豆种植户正面临“极大的”财务压力。随着收获季迅速到来,美国就大豆出口与中国越晚达成协议,美国豆农受到的冲击就越严重。拉格兰在信中写道: ...

  • 干净人陈佩斯和他的《戏台》:必须更好地失败! | 豫记
    干净人陈佩斯和他的《戏台》:必须更好地失败! | 豫记

    多年来网上流传有一段采访,主持人问陈佩斯老师,这些年你获得过什么奖吗?他答:没有。你的作品获得过什么奖项吗?他又答:没有。主持人有些错愕,正要组织语言……这时,陈佩斯先生说:我是一个很干净的人。每次想 ...

  • 郑栅洁:推动整治内卷式竞争、拓展产业链供应链合作
    郑栅洁:推动整治内卷式竞争、拓展产业链供应链合作

    来源:财联社财联社7月23日电,国家增长改革委主任郑栅洁7月23日主持召开企业座谈会,围绕科学编制“十五五”规划,听取关于国企民企协同增长的意见建议。座谈会上,参会企业负责人介绍了所在行业增长现状、面 ...

  • 俄罗斯上半年二手电动汽车销量增长7%
    俄罗斯上半年二手电动汽车销量增长7%

    据塔斯社援引分析机构Autostat消息报道,2025年上半年俄罗斯二手电动汽车销量5537辆,较去年同期增长7%。具体来看,在各品牌销量排名中,日产以2000辆的销量领跑销售市场,极氪Zeekr)以 ...

  • 港交所陈翊庭:港交所将研究24小时交易机制
    港交所陈翊庭:港交所将研究24小时交易机制

    在港交所2025年中期业绩会议上,港交所集团行政总裁陈翊庭表示:“港交所在保持全球竞争力方面始终坚持战略性投入原则。港交所在资本开支方面不会吝啬,我们持续加大在信息平台优化、交易结算系统升级等方面的投 ...

  • 社媒上点赞最多的自拍:C罗3170万领衔、荷兰弟&赞达亚在列
    社媒上点赞最多的自拍:C罗3170万领衔、荷兰弟&赞达亚在列

    海外博主整理了社媒上点赞最多的自拍,C罗与乔治娜以3170万领衔,荷兰弟与赞达亚这对CP在前五中占据2席。我的MJ玛丽-简),过最开心的生日哦~蜘蛛侠一如既往护航!掐我一下紫罗兰化学反应生日快乐,送给 ...

  • 海文儿时和贝克汉姆合过影,参观完梦剧场就立刻决定去曼联
    海文儿时和贝克汉姆合过影,参观完梦剧场就立刻决定去曼联

    艾登-海文和妈妈日前一起接受了采访,海文妈妈透露了他儿时的一些趣事,晒出了一张海文儿时和贝克汉姆的合影。“当艾登六岁时,我们带他去参加一个周日联赛,比赛的比分好像是17-1。“他们把我拉到一边,说,‘ ...

  • 四川警方通报乘客在飞机上打架
    四川警方通报乘客在飞机上打架

    [四川警方通报乘客在飞机上打架]#航班飞行中打架多名乘客被处罚# 四川机场公安通报:2025年7月21日22时许,我局接报警称:某进港航班上有旅客发生纠纷。航班落地后,警方立即到场处置。经查,航班飞行 ...

风站点Hinton与姚期智对谈:认为人类的意识特殊,那是危险的无稽之谈
风集潮干净人陈佩斯和他的《戏台》:必须更好地失败! | 豫记
专台大佬死后,一代艳星瘦成纸片人,干保洁,做服务生,渴望普通生活
风报讯歌手旺仔小乔蒙面开唱:艺术探讨不应滑向网络暴力
风谈谈特朗普和莫迪,现在都很愤怒
全集探秘海丝起点:重温刺桐盛世,赓续海丝文脉

风点集

更多 >