
发布时间:2024-11-20 09:06 | 作者: 安博电竞
智通财经APP获悉,光大证券发布研报称,OpenAI发布的最新模型o1,在编程、理科竞赛等推理密集型任务中性能明显优于GPT-4o,但在部分自然语言任务中较弱。受限于模型性能,AI应用进入瓶颈,北美科技巨头26年资本支出持续性以及上游算力产业链的业绩成长性受到质疑。而近期前沿论文和o1展现的强化学习推理、思维链等底层技术,是AI产业高质量发展和投资情绪提振的关键。新的 Scaling Law,RL+COT 对于实现能自主规划的 Al Agent 至关重要。北美科技公司进入新一轮AI投资周期,资本支出大幅度上升可能使公司面临成本压力,科技巨头或会更加重视AI投资的性价比。
事件:2024年9月12日,OpenAI发布最新模型o1,在编程、理科竞赛等推理密集型任务中性能明显优于GPT-4o,但在部分自然语言任务中较弱。
根据光大证券的测评,o1思维链特征可以概括为:1)优先形成全局方法:在解答前o1会先分析问题、概括底层规律;2)不断的追问和反思:在输出最终答案之前,o1会不断反思解答过程并进行改进,其完整思维链可达数百行。
o1在编程上展现出自主规划能力,AI+低代码/网络安全领域有望最早受益。
1)低代码:o1在编程方面具备较强的自主性,可以某些特定的程度上对冲o1高成本和高延迟的问题。2)网络安全:o1在网络安全攻防中表现优秀,能将复杂任务分解成多个子任务,具备初步的自主规划能力,也体现出了AI辅助网络攻击的潜在威胁,AI驱动的网络安全攻防升级将成为未来的主旋律。
AI Agent是打破AI应用发展瓶颈的关键,o1能否开启通往Agent之路?
受限于模型性能,AI应用进入瓶颈,北美科技巨头26年资本支出持续性以及上游算力产业链的业绩成长性受到质疑。而近期前沿论文和o1展现的强化学习推理、思维链等底层技术,是AI产业高质量发展和投资情绪提振的关键。
新的ScalingLaw,RL+CoT对于实现能自主规划的AIAgent至关重要。强化学习让AI自主探索和连续决策,符合Agent所需的自主规划能力。selfplay通过自主博弈生成高质量数据,有利于突破外部训练数据短缺的现状。
思维链能极大提升模型涉及数学和符号的推理能力,但在别的问题上提升效果不显著,甚至有可能有损模型性能。推理能力和模型的指令跟随能力呈现出分离关系,对于构建AGI来说,如何平衡二者的关系会成为一个核心问题。
RL范式下推理算力需求大幅度上升,但不代表训练算力需求会停止增长。o1-preview生成相同内容的输出tokens大约是GPT-4o的5.9倍,其中72%的tokens为推理过程中生成,使用o1-preview的输出成本约为GPT-4o的36倍。ScalingLaw由训练侧转向推理侧,对推理芯片的性能需求也会提高,且预训练阶段也需要消耗大量的算力。强化学习推理并不代表模型参数停止扩张,因为主模型参数提升可能会产生更好的推理路径。
北美科技公司进入新一轮AI投资周期,资本支出大幅度上升可能使公司面临成本压力。2024年科技巨头资本支出/营运现金流预计将达到40%以上。在AI的投资回报率尚不明显的现状下,科技巨头会更加重视AI投资的性价比。
风险分析:AI研发技术和产品迭代遭遇瓶颈;AI行业竞争加剧风险;商业化进展没有到达预期风险;国内外政策风险。
版权所有 © Copyright 安博全站平台手机版_体育页面登录 京ICP备14037209号-2 京公网安备京ICP备14037209号-2 友情推荐: 安博电竞 | 安博全站平台手机版 | 安博体育页面登录