英伟达新一代RUBIN架构震撼来袭!性能飙升突破摩尔定律,行业变革在即!
投资要点
算力:A100-80G租赁价格有所下降,英伟达下一代RUBIN架构性能阶跃式提升
本周算力租赁平台显卡配置为A100-80G中,恒源云13核+128G价格为8.50元/时,租赁价格有所下降。产业动态上,6月2日英伟达CEO兼创始人黄仁勋于Computex2024上预告了将于2026年、2027年分别推出Blackwell的下一代Rubin架构的首款产品R100与RubinUltra系列产品。新一代Rubin平台架构采用X1600IB/EthernetSwitch,与上一代BlackwellUltra相比,可实现GPU数量由十万个到百万个的阶跃式提升。
AI应用:智谱AI开源GLM-49B系列模型,智能体能力显著增强
6月5日,智谱AI宣布开源其GLM-4-9B系列模型,本次开源的GLM-4-9B系列包括:基础版本GLM-4-9B(8K),对话版本GLM-4-9B-Chat(128K),超长上下文版本GLM-4-9B-Chat-1M(1M)和多模态版本GLM-4V-9B-Chat(8K)。
GLM-4在多个方面实现了显著改进,提升推理速度,大幅降低推理成本。此外,GLM-4-9B显著增强了智能体能力,能够自主根据用户意图,自动理解,规划复杂指令,并灵活调用网页浏览器,代码解释器和多模态文图大模型,以高效完成复杂任务。
AI融资动向:Cohere获4.5亿美元D轮融资
本期AI初创公司的融资中,Cohere/Pika融资额前二,分别为4.5亿/0.8亿美元。Cohere专注于构建NLP模型平台,并采用API技术用于编写和理解自然语言,从而实现人类与机器的语言交互,致力于为开发者提供相关的机器语言处理解决方案。Pika聚焦于生成式视频模型,本次融资过后,Pika计划对软件进行升级,新版本支持生成更高质量、更长时间的视频片段。
投资建议
英伟达将以“一年一代”的节奏推出新的AI芯片,行业龙头正驱动全球AI芯片产业开启“技术性洗牌”。AI芯片加速迭代的背后是AI服务器市场在2024年将保持强劲增长势头,预计多数ODM厂商的AI服务器出货量和市场份额将实现两位数的增长,特别是搭载高端AI芯片,如英伟达H系列和AMDMI系列的机型等出货量有望实现翻倍。
建议关注以AI为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI应用金桥信息(603918.SH)等。
风险提示
1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。