OpenAI再推新智能体Deep Research 在“人类的最后考试”中表现突出

艺都花坊 2025-02-03 娱乐报 4 次浏览 0个评论

　　OpenAI发布了一款新的人工智能工具“Deep Research”，旨在为用户执行耗时的在线研究任务，涵盖从复杂科学问题到汽车推荐等众多领域。这一新工具进一步丰富了这家初创公司的人工智能代理阵容。　

　　Deep Research可能需要 5 到 30 分钟来完成其工作——在你离开或处理其他任务时深入挖掘网络。最终输出以报告的形式出现在聊天中，很快用户还将看到嵌入的图像、数据可视化和其他分析输出，以增强清晰度。这次的时间大大提升了它的能力。例如，在“人类的最后考试”中，深度研究取得了令人印象深刻的 26.6% 的准确率——远远超过了其最接近的竞争对手 DeepSeek R1，后者的得分低于 10%。这一飞跃凸显了系统的迭代优化和结构化综合能力，证明了在人工智能快速发展的步伐中，有些任务确实需要时间。

OpenAI再推新智能体Deep Research 在“人类的最后考试”中表现突出

　　在上周日的博客文章中，OpenAI宣布，这项名为“Deep Research”的服务将通过其ChatGPT在线聊天机器人向特定付费客户开放。该工具能够根据用户的指令，在线搜索文字、图像、PDF文件以及用户上传的文件，进而生成一份详尽的报告。OpenAI将这一功能比作研究分析师，并强调它能够在“几十分钟”内完成通常需要一个人“数小时”才能完成的工作。

　　不过，OpenAI也提醒用户，“Deep Research”仍处于早期阶段，可能会将虚构信息误认为事实，且在区分谣言和准确信息方面可能存在困难。此外，这款研究工具“非常耗费计算资源”，初期用户每月仅能提交100次查询。

转载请注明来自个人学习使用0830，本文标题：《OpenAI再推新智能体Deep Research 在“人类的最后考试”中表现突出》

艺都花坊 36篇文章站点微博

每一天，每一秒，你所做的决定都会改变你的人生！