《TPU新纪元:专为AI计算打造,电子行业新趋势解析》
投资要点:
TPU:为更专用的AI计算而生,引领AI芯片时代
作为一种AI芯片,TPU是专用集成电路(ASIC)的代表。主流AI芯片架构包括GPGPU、ASIC和FPGA,我们一般认为GPGPU为改善CPU效率而生,而TPU可以进一步改善GPGPU未优化完全的部分,三者是从通用到专用不断演进的过程。我们通过梳理发现,TPU在性能功耗比、集群算力利用率上相较于GPGPU有较大优势。主要由于:(1)芯片层面:TPU专为矩阵乘法而设计,脉动阵列、低精度等设定均适用于AI算法,能够处理大量数据以及复杂的神经网络;(2)集群层面:谷歌自研光学芯片Palomar,构建集群互连优势;TPU与TensorFlow良好适配,软件与硬件相得益彰,能够发挥出1+1>2的效果。站在当下回望,我们发现,TPU具备的优势其实最终都形成了AI芯片共同的趋势,在优化方向上大同小异,而谷歌的强大在于“前瞻”。
谷歌TPU:量级仅次于NVIDIAGPU,自建租赁模式吸引头部客户
尽管谷歌没有对外出售自研的TPU,但随着TPUv4(2021年推出)和大型语言模型的出现,谷歌芯片业务的规模显着增加,23年TPU已经突破了200万颗量级。根据Capvision,谷歌TPU70%-80%的算力用于内部业务场景使用,剩余20%-30%以租赁方式供外使用。据集微网,目前全球已经有多家科技公司使用谷歌的TPU芯片。超过60%获得融资的生成式AI初创公司和近90%生成式AI独角兽都在使用谷歌Cloud的AI基础设施和CloudTPU服务,如Anthropic、Midjourney、Salesforce、HuggingFace和AssemblyAI。苹果自TPUv3时代便开始使用GoogleTPU+GPU算力,24年7月,苹果公布其使用了2048片TPUv5p芯片来训练拥有27.3亿参数的设备端模型AFM-on-device,以及8192片TPUv4芯片来训练大型服务器端模型AFM-server。
国产TPU:中昊芯英初露锋芒,国产TPU登上舞台
除谷歌外,国产TPU厂商中昊芯英逐渐崭露头角。从产品上看,公司首款TPU芯片刹那已于23年底量产,为国内AI产业提供自主可控方案。从业绩上看,公司是国内AI芯片唯二盈利的企业(另一个为华为海思),自我造血能力强。据公司CEO表示,公司23年实现了4.85亿的营收和8000万的净利润,已通过商业化的阶段性成功逐步实现了自我造血的能力。我们分析其成长路径,自身实力与需求因素共同驱动,不可或缺:一方面,公司CEO曾在Google作为芯片研发核心团队唯一的华人研发leader深度参与TPU2/3/4的设计与研发,履历丰富,团队阵容豪华。另一方面,公司已获青海“丝绸云谷“绿色算力项目订单(首批订单超9亿元),并将联手深圳联通共建广东首个国产TPU智算中心,大订单支撑公司早期成长。展望未来,我们认为国产智算中心会是一个庞大的算力市场,国产TPU有望大展宏图。
建议关注
海外TPU龙头:谷歌
国产TPU厂商:中昊芯英(未上市)、艾布鲁
风险提示
AI需求不及预期的风险;TPU技术升级不及预期的风险;市场竞争加剧的风险。