DeepSeek和智谱都将于近日发布新模型,或将迎来重大突破

国内两家最头部的大模型企业。

微信图片_20250929173012_421_362.png
据IPO早知道消息,DeepSeek于9月29日发送更新新模型的公告,DeepSeek-V3.2新模型已被上传至社区平台HuggingFace。

另据「IPO早知道」了解,智谱新模型GLM-4.6也将于近日发布,目前部分用户已可通过API接口调用。

这意味着,DeepSeek和智谱这两家中国最为头部的大模型企业都有望迎来新的重大进展。

往前追溯,DeepSeek于8月正式发布 了DeepSeek-V3.1。本次升级包含以下主要变化:1、混合推理架构:一个模型同时支持思考模式与非思考模式;2、更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;3、更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。

而智谱则在7月新一代旗舰模型 GLM-4.5,专为智能体应用打造的基础模型,其首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。8月,智谱还推出了全球 100B 级效果最佳的开源视觉推理模型 GLM-4.5V(总参数 106B,激活参数 12B)。

本文为IPO早知道原创

作者|Stone Jin

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论