Google Gemini 2.5 Pro新版本性能大幅提升,代码推理能力超越竞品
日前,Google Gemini 2.5 Pro 宣布推出新版本「Gemini 2.5 Pro(0605)」。

性能表现上,Gemini 2.5 Pro 新版在代码、推理等任务表现更强:
在 Humanity’s Last Exam(人类最后的考试)中,以 21.6% 的成绩超越 OpenAI o3;在 GPQA 测试中,以 86.4% 的成绩位居榜首。
大模型竞技场中,Gemini 2.5 Pro 新版在 Elo 评分上,相较于 (0506) 版本提升了 24 分(达到 1470 分),保持领先地位。
据 Google 介绍,本次 (0605) 版本是基于今年 I/O 大会上公布的 (0506) 版本所构建,并且新版有望成为 Gemini 2.5 Pro 的正式稳定版「出道」。
另外,Google 还给新版 2.5 Pro 进行了回答改进,目前它可以提供更富有创意且格式更优的答复。
免责声明:本站所有信息均来源于互联网搜集,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻删除。




