这是苍穹猎鹰第404篇演化日记
DeepSeek:在质疑中探寻智能本质
本文只是小编的观点分享,列举的数据和逻辑只为了分析说明,不构成任何的决策建议。
沉寂良久的DeepSeek,其团队于2025年10月20日发布的多模态光学字符识别DeepSeek-OCR模型,其核心创新在于通过视觉-文本压缩范式重新定义了文本处理效率的边界。
这一模型在 AI 领域引起广泛关注。
回顾DeepSeek的发展,从年初横空出世,到后续热度逐步冷却,近期甚至出现了争议声音。
网上甚至还流传着“DeepSeek使用率从50%暴跌至3%”的观点,这到底是“标题党”还是DeepSeek真的“泯然众人矣”?
1/5 DeepSeek真的“凉了”吗?
对于网传“DeepSeek使用率暴跌”的观点,红衣主教周鸿祎在头条号里也做了分析。
根据他的观点,目前DeepSeek-R1和DeepSeek-V3两个模型,加起来使用率大概在3%左右,较2月份的7%,确实跌了不少,但也没有网上传的从50%跌到3%那么夸张。
而且,这也不能说明DeepSeek就凉了。
根据红衣主教的说法,DeepSeek网页端的服务流量确实下降了不少,但DeepSeek的业务重点并不在这方面,而是一门心思在做AGI,根本没有把网页流量当回事,也没有增加什么新功能,慢慢的C端用户可不就少了。
小编曾经听一个AI创业者讲过类似观点,意思是说DeepSeek重心在探究智能的本质,并不特别关注网页流量。
关键在于,很多关注用户量增长的AI公司,往往需要巨额融资,不得不把自己置于聚光灯下,通过海量曝光吸引用户和投资人,才能把“宏大叙事”继续下去。
但鲜有听到DeepSeek融资的消息。有两种可能,一种可能是DeepSeek通过toB端的API服务收费盈利。
根据顺福资本创始人李明顺的观点,“DeepSeek的高性价比解决方案仍有机会创造利润,至少在财务上,通过toB端的API服务就可能补贴toC端的成本,有望达到盈亏平衡。”
另一种可能是,DeepSeek的母公司幻方量化,是‘国内量化四大天王’之一,高峰时期管理私募资金规模达到千亿。
这也说明,DeepSeek并不像其他AI创业公司一样“缺钱”。既然不缺钱,就可以专注于技术,不需要费力讨好那些“金主爸爸”。
周鸿祎在视频里也提到,把第三方托管的DeepSeek的使用量拉出来就会发现,半年时间,通过第三方渠道使用DeepSeek的用户量,足足增长了20倍。
大家不是不用DeepSeek了,而是不在DeepSeek的官方平台使用。
现在腾讯、百度,还有纳米AI,不少手机的AI助手,都接入了DeepSeek,这第三方入口多了,直接去官方服务的人自然就少了。
我们打开腾讯元宝,里面就能看到DeepSeek的入口。
2/5 DeepSeek-OCR:小模型大能量
回到前面提到的新模型DeepSeek-OCR。
这是一个只有30亿参数的小模型,和当前直动辄上万亿参数的主流大模型,简直不值一提,但为什么却在AI领域引起了不小的波澜?
首先,得了解什么是OCR技术?小编也不懂,查一下豆包给出的解释:
OCR(Optical Character Recognition)模型是指将文本图像转换为机器可读文本格式的技术模型。它能识别图像中的文字、数字和符号等信息,并将其转化为可编辑的文本,广泛应用于文档处理、数字图书馆、图像识别等领域。
可以大概理解为一个处理文本图像信息的模型,这又有啥值得关注的?
根据快刀青衣在专栏的解读,就可以明白,DeepSeek团队压根不是单纯做一个模型,而是在研究一个更深的问题:AI处理信息时,用“看图”的方式比“读文字”能省多少算力?
经过实验发现:一篇包含约1000个“文字token”的文档,如果换成“看图”的方式处理,只用100个“视觉token”,就能以97%的精度还原出来。
相当于把信息直接压缩了10倍,几乎没有损失。即使压缩比例提高到20倍,信息准确率还能保持在60%左右。
这样一来,面对文档这类文字密集型信息,用视觉模型编码、压缩,效率远高于传统纯文本处理方式。
3/5 从OCR看DeepSeek的独特洞见
长文本在低分辨率下会变得模糊,DeepSeek的研究人员从中看到了一个更深层的逻辑——人类记忆的遗忘机制。
我们对于刚发生的事,记得一清二楚,过程丝毫不差;一天前的事,可能就只剩下关键情节;一周前、一个月前、一年前的事,可能只记得大概。
这种记忆随时间衰退的过程,和图像分辨率降低的样子很像。越久远的记忆,就像越模糊的图片,只保留了大致的轮廓。
这个就给DeepSeek研究团队一个大胆的想法:能不能用这种“视觉压缩”的方式模拟AI的遗忘机制?
就是把AI之前的对话历史,用不同分辨率的“视觉token”来存储。最近的对话用高分辨率,保留细节;稍微久一点的对话,就降低分辨率,压缩一些细节;更早的继续降低分辨率,只保留大致框架。
这样一来,AI就能像人一样,对近期的事情记得清清楚楚,对远期的事情只留个模糊印象。这样既节省了计算资源,又符合我们使用AI的实际场景。
4/5 遗忘——智能的隐藏密码
这不仅是一次简单的技术优化,更是在探索AI如何像人一样“主动遗忘”,因为遗忘本身就是一种智能。
如果没有遗忘,那是多么可怕的事情。如果你对十年前每天发生的事、吃过的食物都一清二楚,那大脑早就被无用信息塞满。
遗忘就是一种筛选机制——让重要的信息留下来,不重要的自然淡化。
移动互联网时代,只要你想,随时随地都可以获取各种各样的信息。这意味着什么?意味着学习成本降低了,但思考的要求提高了。
当信息唾手可得的时候,决定性的因素就不是获取信息,而是甄别、筛选、删减信息。
“主动遗忘”的能力,相当于做减法。
数字化时代寻找机会,本质上就是把不重要、不擅长、不感兴趣的剔除掉,留下来的自然就是精华。
对于有一定阅历的人来说,重要的不是做了什么,而是不做什么。
5/5 不走寻常路的创新者
DeepSeek团队有两个特别突出的特点。
一个是他们从来不按常规套路出牌。当大家都在拼命地为大模型堆算力和参数的时候,他们却选择改进模型算法,以更小的资源获得相当甚至更优的性能。
别人做OCR,想的是怎么把文字识别得更准确;DeepSeek做OCR,却在研究“一张图能压缩多少文字”这个根本的问题。
他们推出的OCR模型,只有30亿参数,激活参数才5.7亿,但效果却能超过那些动辄上百亿参数的大模型。
另一个就是他们专注到极致。专注于智能技术本身,几乎不怎么关注外界评价、用户体验、资本运作。
快刀青衣借用一次AI行业闭门讨论会的评价,“DeepSeek这个团队把所有精力都放在了一个很窄的点,把后续很多东西都放弃了。他们不是单纯地服务人,而是做智能本身。”
AI发展的方向,也许不是靠无限的算力,而是靠智能的遗忘。
本文只是小编的观点分享,列举的数据和逻辑只为了分析说明,不构成任何的决策建议。
参考资料:
东方财富网:《大模型成本利润率高达545% 却有厂商选择停服!DeepSeek的“效率革命”谁在赚钱谁在亏本》
周红祎《大家并没有不用DeepSeek,而是对它的使用不局限于它的官方平台》
快刀青衣《一张图能装下多少文字?DeepSeek-OCR探索AI的“遗忘机制”》
· END·
 下载格隆汇APP
          下载格隆汇APP
         下载诊股宝App
          下载诊股宝App
         下载汇路演APP
          下载汇路演APP
        
 社区
              社区
             会员
              会员
            


