全球AI数据领域近日迎来重磅事件,
大数据平台巨头Databricks宣布完成超10亿美元K轮融资,投后估值突破1000亿美元,创下AI基础设施赛道融资新纪录。
这家以“数据湖仓”技术闻名的企业,通过打通数据存储、分析与应用的全流程,并融入生成式AI功能,已成为全球企业数字化转型的关键支撑。
此次融资不仅验证了AI数据赛道的商业价值,更凸显了“数据要素”在人工智能发展中的核心地位。
人工智能的突破离不开算法、算力与数据三大支柱。
其中,高质量语料数据更是决定大模型能力的“天花板”,
它为模型提供训练素材,直接影响算法对语言模式、语义结构的理解能力。
当前我国大模型在算力与算法层面已显著进步,但“高质量语料数据供给难、流通难、使用难”已成为行业发展的主要瓶颈。
这一瓶颈体现在两方面:
一是公共数据开放不足,企业自采数据成本高昂;
二是数据隐私与安全法规限制了跨主体流通,导致“数据孤岛”现象普遍。
随着国家数据局启动高质量数据集建设工作,政策端正加速破局,未来数据供给匮乏问题有望缓解,数据的价值也将在大模型落地过程中被进一步挖掘。
Databricks的崛起,本质是抓住了企业对“统一数据管理+AI分析”的需求。
其“数据湖仓”架构替代了传统数据仓库与数据湖的割裂状态,实现结构化与非结构化数据的统一存储、查询与分析,并通过生成式AI工具降低数据应用门槛。
这一模式证明,在AI时代,能够高效整合数据资源、释放数据价值的企业将占据先机。
国内市场中,类似需求正在爆发。企业不仅需要基础的数据管理工具,更渴望通过AI挖掘数据中的深层价值,
例如智能决策、预测分析等。这为具备数据整合能力与AI技术储备的厂商提供了广阔空间。
在政策支持与市场需求双重驱动下,具备高质量数据资源或技术能力的企业有望受益:
海天瑞声
$海天瑞声(SH688787)$ :作为国内AI训练数据龙头,公司专注于数据资源定制服务与数据库产品,覆盖语音、图像、文本等多模态数据,为大模型训练提供“燃料”。其数据采集、标注能力直接关联模型效果,在高质量语料需求增长中具备核心优势。
博睿数据
$博睿数据(SH688229)$ :聚焦IT运维与大数据分析,公司自研的多模态联邦数据查询引擎(Zeus)与一体化数据模型(OneService),能够高效整合企业分散的运维数据,并通过AI技术实现智能监控与决策。其技术积累与场景落地能力,契合“数据湖仓”趋势下的企业需求。
Databricks的千亿美元估值,本质是对“数据+AI”商业模式的认可。
在国内,随着政策推动数据要素流通、企业加速数字化转型,数据已从“成本中心”升级为“价值资产”。
未来,能够打通数据壁垒、释放数据潜能的厂商,或将迎来估值与业绩的双重提升。
因此数据要素产业链中的“卖水人”(如数据服务商、AI训练数据提供商)值得重点关注。