OpenAI再推新智能体Deep Research 在“人类的最后考试”中表现突出

OpenAI再推新智能体Deep Research 在“人类的最后考试”中表现突出

艺都花坊 2025-02-03 娱乐报 4 次浏览 0个评论

  OpenAI发布了一款新的人工智能工具“Deep Research”,旨在为用户执行耗时的在线研究任务,涵盖从复杂科学问题到汽车推荐等众多领域。这一新工具进一步丰富了这家初创公司的人工智能代理阵容。 

  Deep Research可能需要 5 到 30 分钟来完成其工作——在你离开或处理其他任务时深入挖掘网络。最终输出以报告的形式出现在聊天中,很快用户还将看到嵌入的图像、数据可视化和其他分析输出,以增强清晰度。这次的时间大大提升了它的能力。例如,在“人类的最后考试”中,深度研究取得了令人印象深刻的 26.6% 的准确率——远远超过了其最接近的竞争对手 DeepSeek R1,后者的得分低于 10%。这一飞跃凸显了系统的迭代优化和结构化综合能力,证明了在人工智能快速发展的步伐中,有些任务确实需要时间。

OpenAI再推新智能体Deep Research 在“人类的最后考试”中表现突出

  在上周日的博客文章中,OpenAI宣布,这项名为“Deep Research”的服务将通过其ChatGPT在线聊天机器人向特定付费客户开放。该工具能够根据用户的指令,在线搜索文字、图像、PDF文件以及用户上传的文件,进而生成一份详尽的报告。OpenAI将这一功能比作研究分析师,并强调它能够在“几十分钟”内完成通常需要一个人“数小时”才能完成的工作。

  不过,OpenAI也提醒用户,“Deep Research”仍处于早期阶段,可能会将虚构信息误认为事实,且在区分谣言和准确信息方面可能存在困难。此外,这款研究工具“非常耗费计算资源”,初期用户每月仅能提交100次查询。

转载请注明来自个人学习使用0830,本文标题:《OpenAI再推新智能体Deep Research 在“人类的最后考试”中表现突出》

每一天,每一秒,你所做的决定都会改变你的人生!
Top
网站统计代码