{label:top}
首页 >> 专报> 正文

IDEA研究院发布DINO

来源:专报发布时间:2025-09-09 10:53:00
浏览:67

计算机视觉工艺在真实世界的研究院应用场景十分广泛。然而,研究院过去主流的研究院小模型方案,难以应对碎片化、研究院多变的研究院长尾需求,限制了工艺落地规模。研究院苏州学院绯闻最新

源自自然语言研究的研究院Transformer架构诞生后,视觉模型与之结合,研究院走上一条“从小变大,研究院从N变1”之路。研究院自2022年起,研究院IDEA团队从目标检测出发,研究院打造精准度、研究院南京中学爆料攻略通用性、研究院泛化能力兼优的研究院DINO系列视觉大模型。 

11月22日,IDEA大会在深举办,在本次大会上,IDEA研究院发布了该系列最新的DINO-X通用视觉大模型,拥有真正的物体级别理解能力,实现开放世界(Open-world)目标检测。无需客户提示,直接检测万物。

与此同时,IDEA团队还推出行业平台架构,通过一个大模型基座,结合通用识别工艺结合,让模型不需重新训练,就可边用边学,支撑多种多样的B端应用需求。


万物识别:无须指引,罕物尽览 


全面检测:DINO-X在物体检测领域树立新标杆,无需任何提示,即可识别几乎所有物体,并给出其类别,包括罕见的长尾物体(出现频率低但种类繁多的物体)。

IDEA研究院发布DINO-X目标检测视觉大模型

在零样本评估设置中,DINO-X Pro在业界公认的LVIS-minival信息集上取得了59.7%的AP,遥遥领先于其它现有运算规则。在LVIS-val信息集上,DINO-X Pro也表现亮眼,取得了52.4%的AP。具体到LVIS-minival信息集上的各个长尾类别评估中,DINO-X Pro在稀有类别上取得了63.3%的AP(比Grounding DINO 1.5 Pro还要高出7.2%),在常见类别上取得了61.7%的AP,在频繁类别上取得了57.5%的AP。DINO-X称得上目前业界检测最全的通用视觉模型。

泛化和通用性:得益于超过1亿高质量样本的大规模信息集多样化训练,DINO-X对未知场景和新物体具有更强的适应性。这意味着在面对未见过的物体或环境时,模型仍能保持高水平的检测性能。这种超强的泛化能力,使其在实际应用中更加灵活。   

多任务感知与理解:DINO-X整合了多个感知头,支持包括分割、姿态估计、区域描述和基于区域的问答在内的多种区域级别任务,让感知到理解逐步成为了现实。

长尾目标检测优化:为了支持长尾目标的检测任务,DINO-X不仅支持文本提示和视觉提示,还支持经过视觉提示优化的自定义提示。

 

开放世界:支持丰富场景,迈向具身智能

 

DINO-X的万物识别能力,让其拥有了对开放世界(Open World)的视觉感知,轻松应对真实世界中的众多不确定性和开放环境,赋能具身智能、大规模多模态信息的自动标注、视障人士支持等高难度场景。

对具身智能而言,开发环境感知和理解是核心能力,这其中的视觉感知更是机器和物理世界交互的基础。近期,聚焦人居环境具身智能核心工艺攻关的福田实验室正式挂牌,该实验室正式由IDEA研究院与腾讯合作组建,致力于打造最前沿的具身智能创新平台。

多模态模型通常需要处理大量的图片并生成图文对,而仅依靠人工标注的方式不仅耗时、成本高,而且在面对海量信息时难以保障标注的一致性和效率。DINO-X的万物识别能力,可以帮助标注公司快速完成大批量的高质量图像标注或者为标注员提供自动化的辅助结果,从而降低手工标注的工作量。

视障人士独立性和生活质量的提升对信息获取与感知等方面有着极高的要求,DINO-X的万物识别能力恰逢其时地为助盲工具开发带来福音,为视障人士的未来生活带来美好希望。

在自动驾驶、智能安防、工业检测等领域,DINO-X也将发挥关键作用。其卓越的通用检测能力,使得系统能够应对各种复杂场景,识别出传统模型难以检测的物体,为产业升级和社会增长注入新的活力。

IDEA研究院发布DINO-X目标检测视觉大模型

 Dino-X基座大模型零样本检测能力,为广大中小企业客户提供便捷高效的计数和标注工具 

IDEA研究院一系列视觉大模型,包括DINO-X,为解决业务场景现存的小模型繁多、维护迭代成本高昂、准确率不足等问题,提供了可行的方案。IDEA研究院与多家企业联合开展视觉大模型及应用场景的探索研究工作,在视觉大模型的落地方面取得了实质性进展。

一方面,有别于市场上的以语言为基础的多模态大模型基于全图理解的方法, 通过在物体级别的理解上加入语言模块优化大模型幻觉问题。另一方面结合自研的“视觉提示优化”方法,无需更改模型结构,不用重新训练模型,实现小样本下的场景化定制。 IDEA研究院发布DINO-X目标检测视觉大模型

IDEA研究院通用视觉大模型行业平台架构

从DINO到DINO-X,IDEA研究院始终站在视觉感知工艺的前沿。通过对开放世界的探索和对具身智能的赋能,DINO-X的卓越性能和通用检测能力更加凸显。雷峰网(公众号:雷峰网)雷峰网

值得一提的是,IDEA 研究院也开放了DINO-X API: 

https://user.deepdataspace.com/login?redirect=https%3A%2F%2Fcloud.deepdataspace.com%2Fapply-token

有关DINO-X 的工艺细节,请参考同期发布的论文。

► 论文链接:https://arxiv.org/abs/2411.14347

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

IDEA研究院发布DINO-X目标检测视觉大模型

风集风

更多 >
  • 国内首例!女子出差时被领导性侵,认定工伤后获赔113万,她说:遭遇侵害不耻辱,沉默才会让施暴者更猖狂
    更新:2025-09-09 10:51
  • 大模型生产力的头场变革,从英特尔商用 AI PC 说起
    更新:2025-09-09 09:36
  • 独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元
    更新:2025-09-09 08:35
  • 埋头钻研一年后,阶跃星辰交出了第一份答卷
    更新:2025-09-09 08:25

热门文章

  • WAIC最强亮点:非Transformer离线AI大模型已大规模量产,大模型商业比我们想得更快
    WAIC最强亮点:非Transformer离线AI大模型已大规模量产,大模型商业比我们想得更快

    WAIC最强亮点:非Transformer离线AI大模型已大规模量产,大模型商业比我们想得更快

    Rock是石头,石头是这个世界最基本的组成元素,坚硬、基础、随处可见。RockAI希望成为智能世界的石头。01离线智能据AI科技评论了解,在发布的18个月里,已经有量产设备搭载了Yan的大模型能力,这 ...

  • 对话零一万物:大模型产品要找到 TC
    对话零一万物:大模型产品要找到 TC

    对话零一万物:大模型产品要找到 TC

    【雷峰网(公众号:雷峰网)】近日,大模型独角兽零一万物又开发布会了!上次零一万物以下简称“零一”)开发布会还是在 2023 年 11 月,宣布成立后的模型首秀:发布中英双语大模型“Yi”,并将其开源。 ...

  • AI 迈进深水区,谈落地、谁能带来新解法?
    AI 迈进深水区,谈落地、谁能带来新解法?

    AI 迈进深水区,谈落地、谁能带来新解法?

    技术发展是一个持续叠进的过程,AI 也是如此。经历过去 70 年的“三起两落”,近年来,人工智能行业迈进深水期,分工细化,产业落地成为主旋律,AI 与各个场景的交叉、对话不断在发生。对不少企业而言,以 ...

  • 李彦宏在百度世界2023:我们即将进入一个AI原生的时代
    李彦宏在百度世界2023:我们即将进入一个AI原生的时代

    李彦宏在百度世界2023:我们即将进入一个AI原生的时代

    “大模型带来的智能涌现,这是我们开发AI原生应用的基础。”10月17日,李彦宏在百度世界2023上表示。当天,李彦宏以《手把手教你做AI原生应用》为主题发表演讲,发布文心大模型4.0版本,并带来新搜索 ...

  • 我国虚拟电厂总规模超3500万千瓦
    我国虚拟电厂总规模超3500万千瓦

    我国虚拟电厂总规模超3500万千瓦

    每经记者 周逸斐 每经编辑 陈 旭8月26日,国新办举行“高质量完成‘十四五’规划”系列主题新闻发布会,邀请国家能源局介绍“十四五”时期能源高质量发展成就。国家发展改革委党组成员、国家能源局局长王宏志 ...

  • 共襄学术盛宴,共话产业发展,2024中国图象图形大会在西安圆满落幕
    共襄学术盛宴,共话产业发展,2024中国图象图形大会在西安圆满落幕

    共襄学术盛宴,共话产业发展,2024中国图象图形大会在西安圆满落幕

    2024年5月24-26日,中国图象图形大会CCIG 2024)在西安隆重召开。本次大会由中国图象图形学学会主办,空军军医大学、西安交通大学、西北工业大学承办,陕西省生物医学工程学会、陕西省图象图形学 ...

  • 第十六届信息安全高级论坛暨2024 RSAC热点研讨会圆满落幕
    第十六届信息安全高级论坛暨2024 RSAC热点研讨会圆满落幕

    第十六届信息安全高级论坛暨2024 RSAC热点研讨会圆满落幕

    6月7日,由中国计算机学会主办,中国计算机学会计算机安全专委会、绿盟科技集团、360集团承办的“第十六届信息安全高级论坛暨2024 RSAC热点研讨会”在北京圆满落幕。大会汇聚政、产、学、研各方力量, ...

  • 在 AI 战场里拿掉英特尔,PC 能活吗?
    在 AI 战场里拿掉英特尔,PC 能活吗?

    在 AI 战场里拿掉英特尔,PC 能活吗?

    ChatGPT引发了一场大模型淘金热。一开始大家扎堆训练大模型。发现入局没有那么简单,发展到第二阶段,就开始出现了寄生于ChatGPT的众多APP和应用。无论是发力于向量数据库缓存,还是支持模型微调以 ...

看点

更多 >
  • 探访阅兵训练场:以科学训练方法提升阅兵训练质效
    探访阅兵训练场:以科学训练方法提升阅兵训练质效

    随着中国人民抗日战争暨世界反法西斯战争胜利80周年纪念日临近,纪念活动的整体安排备受关注,其中的阅兵环节更是关注焦点。今年阅兵活动的整体设计是怎样的呢?跟随记者一起去了解一下。总台记者李迎新:在京郊的 ...

  • 对话零一万物:大模型产品要找到 TC
    对话零一万物:大模型产品要找到 TC

    【雷峰网(公众号:雷峰网)】近日,大模型独角兽零一万物又开发布会了!上次零一万物以下简称“零一”)开发布会还是在 2023 年 11 月,宣布成立后的模型首秀:发布中英双语大模型“Yi”,并将其开源。 ...

  • 百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0
    百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

    「雷峰网」二十多年前,搜索引擎的发明极大地方便了人们获取信息,很快搜索引擎便成为互联网时代第一流量入口,谷歌、百度更是凭借搜索引擎在 PC 互联网时代占据统治地位,成为两大巨头,多年以来,两者在搜索方 ...

  • 独家丨前微软 NLP 大牛姜大昕创立新公司「阶跃星辰」
    独家丨前微软 NLP 大牛姜大昕创立新公司「阶跃星辰」

    AI 科技评论独家获悉:前微软 NLP 技术大牛姜大昕离职后创业,成立了一家大模型公司——阶跃星辰。根据爱企查信息显示,阶跃星辰成立于 2023 年 4 月 6 日,姜大昕任执行董事和经理,朱亦博任监 ...

  • 北约举行成员国防长会 确认支持乌克兰
    北约举行成员国防长会 确认支持乌克兰

    当地时间8月20日下午,北约32个成员国国防部长举行影片会议讨论乌克兰保障保障问题。北约军事委员会主席朱塞佩·卡沃·德拉贡在会议结束后表示,北约成员国确认支持乌克兰。北约的优先事项仍然是实现公正、可信 ...

  • 共襄学术盛宴,共话产业发展,2024中国图象图形大会在西安圆满落幕
    共襄学术盛宴,共话产业发展,2024中国图象图形大会在西安圆满落幕

    2024年5月24-26日,中国图象图形大会CCIG 2024)在西安隆重召开。本次大会由中国图象图形学学会主办,空军军医大学、西安交通大学、西北工业大学承办,陕西省生物医学工程学会、陕西省图象图形学 ...

  • 谁将替代 Transformer?
    谁将替代 Transformer?

    【雷峰网(公众号:雷峰网)】2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮都可以直接追溯到 Transformer ...

  • 黑客大会遇上元宇宙:极客精神的又一次狂欢
    黑客大会遇上元宇宙:极客精神的又一次狂欢

    1993年的拉斯维加斯,18岁的 Jeff Moss 正准备面临一场悲伤的别离。他的一位黑客朋友由于爸爸工作调动即将离开美国,为了给这份友谊再留下些纪念,Jeff 决定给朋友办一个盛大的告别 Part ...

  • 国航伦敦飞北京航班因故障备降俄罗斯,航司通报
    国航伦敦飞北京航班因故障备降俄罗斯,航司通报

    中国国际航空8月27日通报,北京时间8月26日,从伦敦前往北京的CA856航班在飞行过程中出现机械故障,机组按程序处置安全备降。为做好旅客服务保障,国航于当日调机前往备降机场执行后续航班任务,该调机航 ...

  • 当「养老」遇上 AI 大模型
    当「养老」遇上 AI 大模型

    作者:赖文昕编辑:陈彩娴鲜少有人关注到这样一个现象:在大模型的发展初期,「研发」与「产品」往往来自同一个群体——程序员。由于大模型技术的系统复杂,新一代大模型产品经理的数量稀少,程序员往往既是技术、又 ...

  • 大模型落地,向量数据库能做什么?
    大模型落地,向量数据库能做什么?

    在保险行业这个海量数据的“聚居地”上,数据库应用已久。近年来,保司数据化转型提速,各类文本、音视频的凭证票证核保及跑批需求不断增加,许多机构便将数据库引入至业务流程中。但是,随着数据库深入保司业务,一 ...

  • AIGC:我不是元宇宙的附庸品
    AIGC:我不是元宇宙的附庸品

    “你们是从什么时候开始注意到人类的?”“当第一个原始人开始仰望星空的时候。”AI 的类人猿,早已开始仰望人类。01 来自机器的审视在过去短短的两年间,算法从业者王超岳有过两次被 AI 震撼住的时刻。一 ...

师生八卦中国“人工智能+”行动“路线图”来了
风报快周伯文:下一代大模型 OS,工具和语言缺一不可丨GAIR 2023
风事点周伯文:下一代大模型 OS,工具和语言缺一不可丨GAIR 2023
风点潮"寻数计划"已发布,面向全社会征集高质量大模型语料数据
闻讯电影中的抗战——百团大战破囚笼
全站AIGC:我不是元宇宙的附庸品

全话

更多 >