OpenAI-o1：推理算力全景梳理-格隆汇

今日，一位通信行业的首席分析师针对OpenAI推出的新模型o1进行了分析，探讨了此模型对光模块行业及人工智能发展的潜在影响。分析师指出，o1模型在理工科问题处理上展现了出色性能，特别是在解决复杂问题时展现出高效率，这对于提升整个AI技

今日，一位通信行业的首席分析师针对OpenAI推出的新模型o1进行了分析，探讨了此模型对光模块行业及人工智能发展的潜在影响。

分析师指出，o1模型在理工科问题处理上展现了出色性能，特别是在解决复杂问题时展现出高效率，这对于提升整个AI技术的上限具有重要意义。同时，他认为当前光模块行业面临的估值难题--模型智能程度不足和缺少杀手级应用--在一定程度上因o1模型的推出而得到缓解。分析师对o1模型的未来应用前景保持乐观，预期其将在促进光模块等相关技术进步方面发挥关键作用。

o1模型采用了一种新的训练与推理模式，通过强化学习方法训练，既能简化复杂问题，又能减少对计算资源的需求，尽管其推理过程可能较为耗时。此外，该模型具备小的参数量和数据集需求等特点，展示了在推动训练与推理模式创新方面的潜力。

此讨论亦强调了AI大模型能力的增强对于缓解市场对模型性能上限的担忧、提振光模块公司估值的重要性，展望了AI技术在未来更广泛领域的应用前东。

章节速览

●光模块行业发展与OpenAI o1模型解析

今日，广发通信首席分析师针对0penAI发布的新模型o1进行了初步解读，并探讨了此模型对光模块行业及人工智能发展的影响。首先，关于o1模型，其展示了在理工科问题处理上的优异性能，尤其是在复杂问题上的高效率，而市场更多应关注其对A技术整体上限提升的作用而非短期内的表现。其次，当前制约光模块行业估值的主要因素包括模型智能程度不足以及潜在的杀手级应用缺失，这些问题一直是投资者和市场担忧的重点。然而，OpenA!发布的o1模型在一定程度上缓解了这些担忧，尤其是在模型的聪明程度和解决复杂问题的能力方面。最后，分析师对于o1模型未来的应用前景持乐观态度，并预期其将在推动光模块及相关技术进步方面发挥关键作用。

●强化学习驱动的o1模型

训练与推理的新范式本次讨论关注一种新型的训练与推理模式，区别于以往如GPT-4型的大模型。这种新模式下，模型不仅在训练阶段传授具体的答案或初级样本，而是通过强化学习的方法来训练寻找解决方案的路径，这种方法使得模型能够自主探家解决问题的方法，而非仅仅记忆答案。在推理阶段，由于需要遵循训练中学得的路径寻找答案，因此可能会花费较长的时间，这导致了推理过程中对计算资源的巨大需求。此外，该模型的特点还包括其较小的参数量和数据集需求，以及强化学习的应用，这一点对于非技术领域的观众来说可能相对较新。尽管目前关于此模型的具体细节尚未完全公开，但可以看出其在推动训练与推理模式创新方面的重要潜力。

● 强化学习原理及其应用

强化学习是一种通过奖励函数指导寻找最优解的过程，最初在围棋等游戏中取得突破。其核心在于明确的目标和简单的路径选择使AI容易攻克。Open 10 One利用强化学习与大语言模型结合，简化复杂问题，进行推理，但目前局限于特定领域。未来有望扩展至创造性领域如文学，需更大的训练和推理规模。

●AI大模型发展与光模块市场潜力

对话主要讨论了AI大模型Open AI的能力提升和其对市场的积极影响，特别是针对之前市场对于模型'天花板"的担忧进行了回应。Open Al通过提高在理工科领域的处理能力，展示了其在特定领域的进步，但尚未突破创造性领域的限制。未来，Open o1预计将在本赛道内进一步泛化、探索跨领域的能力提升，并潜在地成为个人A助理或专家模型，以适应不同复杂度问题的需求。此外，讨论还涉及了光模块市场的发展前景，认为随着AI大模型能力的增强和市场对其天花板担忧的缓解，光模块公司的估值有望提升，展现出乐观的投资前景。

要点回顾

o1模型是什么，它解决了市场对光模块估值担忧的哪个问题?光模块市场担忧的主要原因是什么?

o1模型是一种专门在理工科领域表现优异的AI模型，尤其在处理复杂问题上超越了其他通用模型。市场担忧的核心问题在于模型的天花板是否接近极限，即模型是否足够聪明以推动更多杀手级应用的出现。OpenAI发布的o1模型在一定程度上回应了这个担忧，特别是在训练端采用了强化学习的方法，这将推理端对算力的需求大幅增加，暗示了模型潜力巨大，有助于提高市场对光模块未来应用和投资回报的信心。光模块市场主要担忧的是模型的天花板问题，即模型是否具有足够的智能来支撑后续复杂应用的开发。之前市场还曾担心投资回报率和杀手级应用缺乏，但随着A底层技术的发展，这些问题变得不那么迫切。目前的主要关注点在于模型的聪明程度及其天花板。

OpenAl发布的o1模型是否解决了市场对光模块估值的担?

o1模型在很大程度上缓解了市场的担忧，因为它在训练端采用了一种新的方法--强化学习，训练了一个解决问题的路径而非直接提供答案，这使得推理端对算力的需求大大增加。随着推理时间的增长，模型给出的答案质量也会提高，这有助于提升光模块在推理场景中的应用价值，从而解除市场对光模块估值的担忧。

强化学习的基本概念是什么?为什么象棋和围棋在强化学习领域容易被攻克?

强化学习是一种计算方法，通过从奖励函数中得到激励，以找到解决问题的答案。其特点是路径明确，目标导向清晰，类似于在棋类游戏中通过蛮力搜索找到最优解的过程。象棋和围棋因其规则简单，路径明确，每一步都有固定的可选位置。强化学习通过在训练中积累经验，通过激励函数来优化策略，从而能够在短时间内学会并达到较高的水平。

强化学习在即时战略类游戏中的应用如何?

在即时战略类游戏中，强化学习虽然初始阶段A与人类相比可能有差距，但经过足够长时间和大算力的训练，AI的决策能力会逐渐提升，最终可能超越人类。

强化学习在推理端的作用是什么?

在推理端，强化学习通过构建思维链将复杂问题简化，逐步回答简单问题直至得出最终答案。这个过程可能涉及反复尝试不同的路径(类似走迷宫)，以找到在奖励函数评价高的解决方案。

openAl o1目前的发展局限及后续展望有哪些?

目前open AI o1主要集中在数学、物理和医药等路径相对固定且目标导向明确的领域，提升模型天花板。未来发展方向包括本赛道内泛化(在数学或物理赛道上解决更多难题)，跨领域跨赛道发展(进入创造性和文学等复杂领域)，以及私人AI助理和专家模型的发展，以满足不同用户对复杂问题的专业需求。

openAl o1对于光模块市场的影响是什么?

open AI o1通过强化学习的应用回应了市场对模型天花板的担忧，提高了理工科相关领域模型能力天花板，虽然尚未触及创造性和文学等领域的天花板，但已经指明了一条提升路径。

根据市场反馈和业绩预测，认为光模块公司应按照明年的业绩预期进行估值，对于中旭创、新易盛、天天孚通信等公司，预计至少有翻倍的股价空间。

模型能力:在数学竟赛(AIME2024)、代码竟赛、博士级科学问题、各类考试上均大幅领先于gpt40。

=======================

【光大通信】OpenAI发布o1模型，打消部分算力投资持续性担忧，建议关注北美算力链

2024年9月13日，OpenAI发布o1模型（目前可用的为o1-preview，效果大概是完全体的70%），openAI称其在逻辑和推理能力上远强于GPT4o。我们对o1-preview进行了测试，并与chatGPT-4o进行了对比，测试题目采用了2024阿里巴巴全球数学竞赛部分试题（具体测试示例情况可以参考文档），有如下发现：

1.o1-preview答案准确率远高于4o，4o在解决复杂数学问题时基本属于不可用状态，逻辑较为混乱。o1-preview提升显著，在我们的示例问题中，它的表现出色，精准判断出答案并且给出较为严密的推导过程。虽然有些问题o1-preview也无法给出正确答案，但是明显其逻辑推导过程较为合理，如果给予适当纠正则能生成更为合理的答案。

2.o1-preview在解决较为复杂的数学问题上反应时间普遍长于60秒，是4o反应时间的6倍以上。o1在尝试解决问题时使用了一种思维链的方式。它学会将复杂的步骤分解为更简单的部分。当当前方法不起作用时，它学会尝试不同的方法。这个过程显著提高了模型的推理能力。

3.在初期，o1的使用场景应该更多是偏向to B或者是特定领域的专业人士，但我们认为o1是大模型向下一阶段进化的关键一步。目前普遍推测openAI在原有模型基础上增加了Self-play RL（自我强化学习），从原来的相关性学习进化到了因果性学习，链式思维还能提供更多的合成数据供下一代模型训练。

我们认为o1模型的推出对于指导算力投资的意义巨大，此前市场普遍担心算力资本开支26年持续性问题，但o1的推出打消了部分疑虑。大模型的迭代仍在持续，基于scailing law和Self-play RL，预计未来推理的训练的需求仍将加速提升。

鉴于前期北美算力链的调整，目前板块普遍估值不高，建议重点关注：

（1）光模块：新易盛、中际旭创、天孚通信；

（2）PCB：胜宏科技、沪电股份、景旺电子、世运电路等；

（3）铜连接：精达股份、沃尔核材等。

=======================

【国盛计算机】openAI发布o1模型，部分任务推理能力获重大突破

9月13日凌晨，OpenAl宣布其最新的模型OpenAl o1正式发布，包括OpenAI o1-preview和OpenAI o1-mini两个版本。OpenAI称: 对于复杂的推理任务来说，这是一个重大进步，代表了 AI 能力的新水平, 因此我们将计数器重置回 1 并将此系列命名为 OpenAI o1。

openAI训练o1系列模型花更多时间思考问题，然后再做出反应，就像人类一样。通过训练，它们学会完善自己的思维过程，尝试不同的策略，并认识到自己的错误。在openAI的测试中，o1-preview模型更新在物理、化学和生物学的具有挑战性的基准任务上的表现与博士生相似,，并在数学和编码方面表现出色。o1-mini是一种经济高效的推理模型，擅长 STEM，尤其是数学和编码，适用于需要推理但没有广泛知识的应用程序，成本比o1-preview 便宜 80%。

openAI宣布今天开始ChatGPT Plus 和 Team用户将能够在 ChatGPT 中访问 o1 模型。目前每周发送消息次数限制为 o1-preview 30 条消息和 o1-mini 50 条消息。符合API 使用等级 5 的开发人员现在可以开始使用 API 中的两种模型进行原型设计，每分钟请求数限制为 20 RPM。

o1出来，在4系列的基础上大幅加强了复杂数学、代码、博士阶别问题的准确度。我们一直强调，准确度是应用能否出来的关键指标而不是其他（多模态、记忆、长上下文等），起码目前看来，OPENAI探索出了一条路（看起来在POSTTRAIN）阶段能优化部分任务的准确度，使得应用逐步出来。这也让我们更期待明年的5系列是否能带来全向准确度提升。今年我们应用提的很少，但如果GPT5如期待这般，应用将真正到来。

具体应用待挖掘，算力依旧为基，我们建议关注：

1）算力侧：寒武纪、中际旭创、新易盛、中科曙光、海光信息、浪潮信息、工业富联、神州数码、软通动力、协创数据、云赛智联、高新发展等。

2）端侧AI：立讯精密、东山精密、传音控股、鹏鼎控股、中科创达、漫步者。

=======================

【华福电子大科技陈海进】🍓OpenAI-o1：推理算力迈入新时代

📈核心观点：AI应用性能大幅的提升，或将带来用户访问量上台阶式增长，推理算力或将爆发

🚩应用层面：据量子位，o1系列，可以进行通用复杂推理，虽然每次回答要花费更长时间思考，但性能提升明显——在2024 IOI信息学奥赛、美国数学奥林匹克 (AIME)预选赛题目中，获得成绩可以跻身人类选手的前列。相较于GPT-4o，在数理化生、英语法律经济等各种科目都有不同成绩改进。

🚩算力层面：

➡更长的内部思维链对应新的Scaling法则

据量子位，随着更多的强化学习（训练时计算）和更多的思考时间（测试时计算），o1 的性能持续提高，新的Scaling Law诞生了。据机器之心，o1 上线之后，现在 ChatGPT 可以在回答问题前先仔细思考，而不是立即脱口而出答案。就像人类大脑的系统 1 和系统 2，ChatGPT 已经从仅使用系统 1（快速、自动、直观、易出错）进化到了可使用系统 2 思维（缓慢、深思熟虑、有意识、可靠）。

➡更多的用户访问量或对应短期的算力供给短缺&长期的算力需求爆发

#量据 similarweb（0830-0906），OpenAI访问量持续攀升。GPT-4o数据微调功能自8月21日上线以来，持续带动访问量；近期草莓大模型预热对于访问量也有所带动。

#价据智元宇宙援引The information报道，OpenAI高管正在讨论拟定其即将推出的新一代大模型“草莓”和“猎户座”的订阅价格为2000美元/月，而当前ChatGPT Plus订阅价格是20美元/月。其中或隐含OpenAI对应用热度提升的积极预期。

🌟建议持续关注：

- 国产算力链：寒武纪、海光信息、龙芯中科、盛科通信等。

- 数据中心硬件：中际旭创、工业富联、新易盛、天孚通信、沃尔核材、英维克、沪电股份。

OpenAI-o1：推理算力全景梳理

相关阅读

评论