前言:根据技术架构,算力芯片可分为GPU、FPGA、ASIC三大类。
一. GPU(图形处理器)
1.1 基本介绍
(1)概览:最初用于图形渲染,因其大规模并行计算架构,目前为最主流的算力芯片。
(2)特点:高并行架构(同时处理海量数据)、高内存带宽(加速数据吞吐)、通用性强(CUDA等框架成熟)、功耗较高。
(3)应用:消费级(游戏显卡)、专业级(AI训练与推理、自动驾驶芯片)。
1.2 头部厂商
(1)海外:英伟达、AMD、英特尔、高通、苹果。
(2)国内:海思、海光信息、景嘉微、摩尔线程、壁仞科技、燧原科技、沐曦集成、砺算科技(东芯股份)、龙芯中科。
二. FPGA(现场可编程逻辑门阵列)
2.1 基本介绍
(1)概览:半定制芯片,通过编程逻辑单元(CLB)实现功能配置,适合需要实时性和动态调整的场景。
(2)特点:可重构性(部署后仍可修改硬件逻辑,灵活性高)、低延迟、功耗较低。
(3)应用:物联网、通信基站、边缘计算、工业控制。
2.2 头部厂商
(1)海外:赛灵思(AMD)、Altera(英特尔)、Lattice、Microchip。
(2)国内:紫光同创(紫光国微)、复旦微电、安路科技、高云半导体。
三. ASIC(专用集成电路)
3.1 基本介绍
(1)概览:针对特定应用和场景定制的芯片,通过固化硬件逻辑实现极致性能。
(2)特点:专用度高(功能固化、灵活性差)、高性能与低功耗(无冗余逻辑,能效比高)、开发成本高(适合大规模量产摊薄成本)。
(3)应用:AI训练与推理、通信互联、加密货币/区块链。
3.2 AI领域分类
(1)TPU(张量处理器):专为深度学习张量运算定制,适用于AI训练。
(2)DPU(数据处理器):聚焦数据管理,适用于AI训练/推理中的数据搬运与预处理。
(3)NPU(神经网络处理器):在电路层模拟人类神经元,适用于移动端/边缘实时推理。
(4)LPU(语言处理单元):专为自然语言处理场景定制,适用于大语言模型实时推理。
3.3 头部厂商
(1)海外:谷歌、博通、Marvell、亚马逊、AWS。
(2)国内:寒武纪、云天励飞、平头哥(阿里)、昆仑芯(百度)、黑芝麻、地平线、中昊芯英(科德教育)、北京君正、曲速科技(旋极信息)。