X 用户 @Min Choi 专注于分享与人工智能相关的信息, 他请求 Deep Research 列出 20 个 OpenAI o3 推理模型可能会取代人类的工作,并以表格形式呈现,按概率排序 ,列名为“排名”“职业”“为何优于人类”以及“概率”。Choi 随后通过 X 平台分享了这次对话的结果,该帖子至今已获得超 100 万次浏览。
Deep Research被设计为能够执行复杂研究任务,据OpenAI介绍,它能够在短短数十分钟内完成人类专家通常需要数小时才能完成的工作。这一功能在“人类最后的考试”中表现出色,刷新了最高分记录,其推理设置分数甚至高出之前的o3-mini一倍之多。该测试涵盖了从语言学到生态学等100多个主题,包括3000多个多选和简答题。 在另一项名为GAIA的现实世界问题评估基准测试中,Deep Resear ...