AI新里程碑!OpenAI o1惊艳发布,推理能力飞跃突破,传媒瞩目
行业事件
9月13日凌晨,OpenAI发布新系列模型o1。该系列目前包括已部分开放测试的o1preview、o1-mini,以及尚未开放的o1正式版。
技术层面,有望引领scalinglaw新范式
从2020年发布相关论文,到后续推出GPT系列,OpenAI公司持续执行其核心理念“scalinglaw”,即随着模型大小、数据集大小等的增加,模型性能会持续提升。此前,在已发布的GPT系列模型中,“scalinglaw”主要应用于模型的前期预训练环节。而随着o1新系列模型的公布,OpenAI团队也同时宣布发现了“新范式”,即scalinglaw在预训练之后的环节(强化学习以及测试阶段)的应用。据公司公布的材料,随着强化学习(训练阶段)、思考时间(测试阶段)计算量的提升,o1模型的性能有望持续提高;且相较于在预训练阶段进行scaling,新方式中模型性能的提升曲线更为陡峭。
复杂任务处理、数理逻辑能力大幅提升
从实际表现来看,o1相较于GPT等前系列模型,处理复杂问题的能力实现大幅提升,尤其擅长数学、编码等逻辑推理。在OpenAI内部测试中,该系列后续模型在物理、化学、生物等复杂任务中的表现达到博士生水平。OpenAI表示,所有专业领域的开发人员可用o1构建、执行多步骤工作流程,例如可以帮医疗保健研究人员来注释细胞测序数据,助力物理学家生成量子光学所需的复杂数学公式等。
强化学习赋能“链式思考”,回答精准度显著提升
聚焦语言对话场景、快速响应的GPT系列不同,o1在响应用户之前会产生较长的“思维链”,通过尝试不同的策略、认识到错误并修正,最终生成精准度更高的答案。在官网示例中,针对用户提出的复杂编程问题,GPT-4o响应时间短,但得到错误答案;而o1-preview则会先用自己的理解复述要求,再逐步拆解要求、明确最终目标,接着分析限制条件、选择具体方法、拆解步骤,最后才开始编译代码,并一次性得出正确结果。整体来看,o1的回答方式更接近于人类面对复杂问题时的分步思维逻辑,响应时长变长,但精准度显著提升。
投资建议
我们认为,从应用角度,AI有望从目前以文字、图片类生成、交互的简单场景,拓展至更为广泛、复杂度更高、容错率更低的应用场景,包括学术科研、工业流程、游戏影视等复杂内容的生产创作等。随着OpenAI引领的AI大模型技术持续迭代,AI应用落地速度也有望加速提升。建议关注:1)AI模型&应用:昆仑万维、巨人网络、盛天网络、美图公司;2)IP及内容:三七互娱、恺英网络等。
风险提示:技术发展缓慢,AI应用落地缓慢,政策监管趋严的风险。