AMD新旗舰对垒英伟达,AI芯片年更大战升温,行业竞争白热化!
投资要点
算力:算力租赁价格平稳,AMDInstinct产品线更新MI325X同步英伟达
本周算力租赁价格环比持平。在产业动态方面,近期,AMD董事长兼CEO苏姿丰在Computex2024展会的开幕主题演讲中公布了今年将会推出InstinctMI325X,2025年推出MI350,2026年推出MI400。MI325X将具有更大的算力规模,并转向第四代高带宽内存HBM3E。容量大幅提升至288GB,内存带宽提升至6TB/s。与英伟达相比,MI325X内存大小和单服务器可运行模型参数规模是英伟达H200的2倍。内存带宽、理论FP16算力峰值、理论FP8峰值则是英伟达H200的1.3倍,可谓是AMD史上最大的AI性能提升。同时,MI350的内存容量将是英伟达2025年推出的B200芯片的1.5倍,AI算力是B200芯片的1.2倍。AMD预计将在2026年推出基于CDNA"Next"架构的InstinctMI400加速器系列,一年一更同步英伟达。
AI应用:苹果发布AppleInteligence智能系统,正式开启端侧AI新时代
当地时间6月10日,苹果发布了AppleIntelligence,一款深度集成于iOS18,iPadOS18和macOSSequoia的全新个性化智能系统。AppleIntelligence由多种智能生成模型组成,端侧云端混合并行,专为用户日常任务设计。端侧上,AppleIntelligence拥有约30亿参数的语言模型。在设备端和私有云上,苹果对模型生成的第一个token和后续token的推理过程进行了优化,采用分组查询注意力机制、共享的输入和输出词汇嵌入表。设备端模型词汇量为49000,服务器模型为100000,在iPhone15Pro上,从接收到提示词到生成第一个token所需时间约为0.6毫秒,生成速率为每秒30个token。在AppleIntelligence的加持下,Siri的智能化水平进一步提升,具备更丰富的语言理解能力和用户交互体验。
AI融资动向:MistralAI获6.4亿美元B轮融资
本期AI初创公司的融资中,MistralAI/Cognigy融资额前二,分别为6.4亿/1.0亿美元。MistralAI是欧洲最强的LLM大模型公司,在多模态、检索增强生成(RAG)等大模型突破方向有着丰富经验,曾开发Mistral7B、Mixtral8x22B等模型,是OpenAI的强劲对手。Cognigy作为AI客服巨头,专注于对话式AI和生成式AI的研究与开发工作,本次融资用于加速AI自动化技术的研发,并推动其全球扩张。
投资建议
巨头入场加速端侧AI发展。2024年AIPC和AI手机的加速落地标志着AI发展的重点逐步向端侧转移,特别是此次WWDC大会上苹果发布的AppleIntelligence体现了AI颠覆传统消费电子设备体验的潜力。基于此,我们建议关注:1)端侧AI优化手机等产品使用体验,大幅提升生产力,有望加速3C换机周期,建议关注AIPC、AI手机硬件产业链;2)AppleIntelligence推理采用端侧和云侧相结合的方案,有望进一步拉动推理算力需求。
建议关注以AI为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI应用金桥信息(603918.SH)等。
风险提示
1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。