{label:top}

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude

来源:红领巾吃瓜网发布时间:2025-09-09 17:45:08
浏览:6853

8月2日,新王新超lmsys官方在推特发布一则消息,登基度更恭喜DeepMind研发的新王新超Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名登顶,超越GPT 4o和Claude-3.5夺得第一。登基度更

这是新王新超继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来,OpenAI第二次让出Chatbot Arena的登基度更上海医科大学曝光排名Overall ranking宝座。

新王登基,新王新超Gemini 1.5 Pro再度更新,登基度更超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena测试一周后。获得了超过12,登基度更000个社区投票,新王新超在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的登基度更好成绩。之前说GPT-4o有刷分技巧,新王新超现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。登基度更

新王登基,新王新超Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版(0801)不仅在综合表现上极为突出,在各个细分领域上也有着出色的表现。它在数学方面排名前三,北京大学绯闻体验指令遵循排名前二,编码排名前五,硬提示(英语)排名前五。

Gemini 1.5 Pro 实验版(0801)具有强大的多语言能力,在中文、日语、德语、俄语方面均表现第一。

从总体胜率图上,也能看出Gemini 1.5 Pro 实验版 (0801)实力强劲,对阵 GPT-4o 的胜率为 54%,对阵 Claude-3.5-Sonnet 的胜率为 59%。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

前OpenAI的开发者,现Google AI Studio的产物负责人Logan Kilpatrick火速转发,向大家宣布Gemini 1.5 Pro 实验版(0801)目前在 LMSYS 的文本和多模式排名中均位居第一的好消息。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

DeepMind的CEO Demis Hassabis也转发了这条消息,祝贺Gemini 1.5 Pro 实验版(0801)能够在极具竞争力的榜单中拿下第一,并且宣布这一版本的已经可以在 AI Studio上进行试用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

带领研发Gemini的Jeff Dean也随后转发,对此次实验版本的Gemini 1.5 Pro突破1300+elo分数拿下排名第一的好消息感到非常自豪,也很期待未来能看到其他更好的模型。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5


听闻这则消息,其他从业人员也纷纷发来祝贺。


新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有不少人分享自己的试用体验。大神elvis对在聊天机器人领域超越了 GPT-4o 和 Claude 3.5 Sonnet的Gemini 1.5 Pro非常感兴趣。elvis分享了自己的测试全过程影片,并总结道,Gemini 1.5 Pro强大的图像和PDF提取能力给他留下了深刻的印象,Gemini 1.5 Pro有着和GPT-4o不相上下的视觉能力,也有Claude 3.5 Sonnet接近的代码生成及PDF理解/推理能力。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

有人认为Gemini 1.5 Pro在解决高级数学难题方面表现相当不错。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有人说Gemini 1.5 Pro在图像识别植物和动物方面做得确实要比GPT 4o更好。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有更多的人在期待Gemini 1.5 Pro这一版本的正式上线,希望能够API实现Gemini 1.5 Pro的实际运用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

大家对Gemini 1.5 Pro这次发布的实验版本有什么看法,欢迎评论区留言分享~雷峰网(公众号:雷峰网)雷峰网


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

爆榜

更多 >
  • 关于俄乌领导人会晤地点 泽连斯基给出三个选项
    更新:2025-09-09 17:39
  • 《少年书院行》:用青春脚步丈量文明厚度
    更新:2025-09-09 15:53
  • 抖音辟谣:“花费9位数与周杰伦签约”为谣言
    更新:2025-09-09 15:46
  • 2025年电影票房破300亿
    更新:2025-09-09 15:20

热门文章

  • 千百惠曾谈衰老:不要一直想到我年轻的时候,要坦然面对老去
    千百惠曾谈衰老:不要一直想到我年轻的时候,要坦然面对老去

    千百惠曾谈衰老:不要一直想到我年轻的时候,要坦然面对老去

    著名歌手千百惠于8月19日凌晨因病离世,享年62岁。南都N视频记者注意到,千百惠曾表示,“人怎么不会老呢?不要一直想到我年轻的时候,听众长大了,我也老了。我们要坦然面对慢慢老去的事实。”她还说,“我的 ...

  • 老师因学生志愿未报清北解散群聊?校方通报
    老师因学生志愿未报清北解散群聊?校方通报

    老师因学生志愿未报清北解散群聊?校方通报

    情况说明7月6日,网帖反映我校22209班班主任漆某芳老师“对学生填报志愿发表不当言语”。我校立即调查核实,现将有关情况作如下说明:高考成绩公布后,漆某芳老师根据3名学生的高考成绩和与家长沟通的情况, ...

  • 最高50% 特朗普再宣称对8国加征关税
    最高50% 特朗普再宣称对8国加征关税

    最高50% 特朗普再宣称对8国加征关税

    当地时间7月9日,美国总统特朗普在社交媒体上发布了致文莱、阿尔及利亚、摩尔多瓦、伊拉克、菲律宾、斯里兰卡、利比亚和巴西的信件。特朗普宣布对8国关税税率特朗普称,美国将自2025年8月1日起对菲律宾的产 ...

  • 中国正大步迈向全球创新中心
    中国正大步迈向全球创新中心

    中国正大步迈向全球创新中心

    2024年全社会研发经费投入规模增加到3.6万亿元,位居全球第二。从标杆看,深圳研发投入占GDP的比重达6.46%。中国正从全球制造中心大步迈向全球创新中心。 ...

  • 电影中的抗战——百团大战破囚笼
    电影中的抗战——百团大战破囚笼

    电影中的抗战——百团大战破囚笼

    打一个大仗,打出中国人的勇气!1940年8月到1941年1月,八路军在华北敌后发动大规模进攻和反“扫荡”战役,沉重打击了日军“囚笼政策”。这场战役共有105个团,约20万人参战,因此被称为“百团大战” ...

  • 也门胡塞武装:红海受袭希腊货轮沉没
    也门胡塞武装:红海受袭希腊货轮沉没

    也门胡塞武装:红海受袭希腊货轮沉没

    来源:财联社财联社7月10日电,据新华社报道,也门胡塞武装9日发表声明称,该组织的武装部队击沉了在红海航行的希腊货轮“永恒C”号。这是该组织4天内在红海击沉的第二艘货轮。据胡塞武装旗下的马西拉电视台报 ...

  • 上半年我国汽车产销量均超1500万辆 新能源汽车表现亮眼
    上半年我国汽车产销量均超1500万辆 新能源汽车表现亮眼

    上半年我国汽车产销量均超1500万辆 新能源汽车表现亮眼

    中国汽车工业协会今天10日)发布的信息显示,今年上半年,我国汽车工业多项经济指标同比均实现两位数增长。今年以来,我国实施更加积极有为的宏观政策,经济运行总体平稳。1至6月份,汽车市场延续良好态势,产销 ...

  • 上半年我国汽车产销量均超1500万辆 新能源汽车表现亮眼
    上半年我国汽车产销量均超1500万辆 新能源汽车表现亮眼

    上半年我国汽车产销量均超1500万辆 新能源汽车表现亮眼

    中国汽车工业协会今天10日)发布的信息显示,今年上半年,我国汽车工业多项经济指标同比均实现两位数增长。今年以来,我国实施更加积极有为的宏观政策,经济运行总体平稳。1至6月份,汽车市场延续良好态势,产销 ...

风趣潮

更多 >
深榜美联储首次回应特朗普解雇理事库克:将尊重司法裁决
风汇站为涉黑母亲辩护的河南基层法官,涉嫌洗钱罪被刑拘
风点台中方敦促也门胡塞武装维护红海水域航道保障
风闻点商务部:已部署开展打击战略矿产走私出口专项行动
风事视腾讯Q2财报:营销服务358亿!再创新高
快台“众星云集”不是票房灵药

风闻秀

更多 >