OpenAI新一代具关联思考能力的模型o1，可逐步分析推理精确解答问题

2024-09-16 十轮网

OpenAI推出全新大型语言模型o1，其推理能力大幅提升，在数学、程序设计和博士程度的科学问题等基准测试中表现优异，大幅超越先前发布的GPT-4o模型。o1模型的特点在于通过关联思考（Chain of Thought），在多数复杂推理任务中表现接近甚至超越人类专家。在最新的美国国际数学邀请赛（AIME）中取得接近全国前500名的成绩，o1也是目前第一个在GPQA科学测试中超越人类博士的模型。

图片来源／OpenAI

OpenAI o1是一个针对复杂推理问题设计的新一代大型语言模型，相较于之前的模型，o1通过强化学习来增强其推理能力，能够对问题进行深度思考。官方解释，o1关联思考（Chain of Thought）的能力模拟人类解题时逻辑推理过程，借由分步骤分析问题，再做出回应。而这种能力大幅提升o1处理复杂任务的准确性和可靠性。

在数学以及程序设计领域，o1的表现尤为亮眼，展现了解决高难度问题所需要的强大推理能力。以2024年的AIME数学考试为例，o1单次尝试就可解决74%的题目，而通过共识决方法，也就是经多次解法的综合判断，准确度可以提高至93%。在程序设计领域，o1在Codeforces竞技程序测试表现也相当优异，针对国际资讯奥林匹亚（International Olympiad in Informatics，IOI）调校的模型变体o1-ioi，其Elo评分达到1807，超过93%的人类竞争者。

图片来源／OpenAI

o1有能力逐步分析问题，拆解复杂步骤并自动修正错误，而通过强化学习，则又能从每次的尝试中学习改进，持续优化其解题技巧，这让o1模型在解决需要深度推理的问题时，具备更高的准确性、效率和稳定性。

目前OpenAI已经发布o1早期版本OpenAI o1-preview，用户已经可以在ChatGPT中进行测试，并开放给部分受信任的API用户。GitHub也展示了o1模型在程序设计的能力，包括o1-preview如何协助开发者优化复杂算法，甚至找出并解决造成应用程序性能低落的问题程序代码。GitHub官方预计之后会将o1-preview和轻量级o1-mini加入到可选模型的行列，目前开发者需要先通过Azure AI申请早期访问。

除了OpenAI o1在程序设计和数学问题上的先进发展，其他组织也在推进类似的技术进步。DeepMind在今年7月的时候，也展示了其能够解决数学难题的人工智能模型AlphaGeometry 2，该模型可解决了2024年国际数学奥林匹亚竞赛（IMO）6道数学难题中的4道题目，达到了银牌得主的水准。不过，AlphaGeometry 2并非典型的大型语言模型，而是基于Gemini语言模型的神经符号（Neuro-Symbolic）混合系统，专门为处理复杂数学问题的推理和解答而设计。

OpenAI新一代具关联思考能力的模型o1，可逐步分析推理精确解答问题

业界首款16层HBM3E明年送样！SK海力士目标AI内存全方位供货

Meta机器人触觉创新研究，推进人机互动技术发展

Arm高层谈AI趋势，异质运算、小芯片堆栈是机会

Anthropic发布Mac版Claude程序另类人工智能助理选择

黑胶复兴美国最老唱片厂联合唱片压制公司日产8万张供不应求

网友问什么时候推出GPT-5？ OpenAI Altman回应

Meta AI再进化，传自建AI搜索引擎减少依赖Google、微软

澳洲自主战士演习，“鬼鲨”大型无人水下载体首度公开海中运行

持续筛选阿提米丝3号登月地点，NASA公布9个潜在着陆区域

Meta发布Llama 3.2 1B/3B模型的量化版

Intel二代Arc Battlemage显卡规格泄露，2.85GHz频率创新高

OpenAI图片生成AI新方法sCM，速度是传统扩散模型的50倍

美国芯片法加持，Hemlock Semiconductor密歇根州新厂获3.25亿美元补助

黄仁勋：Blackwell AI芯片设计瑕疵问题已解决

传三星S25全线搭载高通旗舰Snapdragon 8 Elite

高通Amon：未来将有成千上万个杀手级应用

IBM公布新AI模型Granite 3.0，以英伟达H100训练

苹果iPhone 16中国热销，开卖三周销量大增20%

美政府松绑规定，部分太空产品出口盟国免许可

Apple Car曾与比亚迪秘密合作，催生刀片电池设计

Mistral公布边缘运算AI模型Les Ministraux

FOPLP势头猛厂商抢攻Chip Last技术！TrendForce估最快2026年量产

NVIDIA开放Blackwell平台设计，宣布Blackwell进入全面量产阶段

神盾集团与Arm共同宣布战略合作，推动AI HPC芯片创新