首页 > 快讯 > 快讯详情

格隆汇8月11日|马斯克:我们上周完成预训练的 V7 基础模型具有原生多模态能力。该模型可直接处理视频 / 音频比特流,无需将其转换为其他形式即可进行理解。例如,它最终能够捕捉到你说话时传递情绪和强调意味的细微差别。