AI推理需求激增,互联网巨头AI大模型建设成果显著,算力市场迎来新风口
投资要点:
本周算力芯片板块和云计算板块出现回调。(1)CPU/GPU板块:本周(0826-0828)海内外股均有承压,其中英伟达-2.91%,英特尔-4.53%,AMD-5.56%,国产算力链中,龙芯中科-6.89%,寒武纪-5.07%,海光信息-2.02%。(2)云计算板块:除商汤科技+1.82%外,其他标的均出现回调,微软-1.49%,亚马逊-3.52%,Meta-2.13%。
一、从国内互联网大厂财报看AI大模型落地
百度智能云业务营收亮眼,文心大模型日调用量超6亿次。8月22日,百度发布24Q2财报,财报显示,公司云业务实现营收51亿元,同比增长14%,其中AI收入占比9%,环比增长30.43%。云业务增长主要原因在于以千帆平台为代表的一站式企业级大模型平台使用量显著增长。据量子位援引Q2财报电话会信息,千帆AppBuilder构建应用量已超数十万。此外,据IDC数据,百度智能云大模型平台产品市场份额达到19.9%,位居第一。
文心大模型热度不减,据量子位援引Q2财报电话会信息,文心大模型日调用量超过6亿次,日均处理Tokens文本超1万亿,相较23Q4的5000万次日均调用量,半年增长超10倍。
百度“含AI量”持续提升,持续推进AI应用落地。(1)百度搜索:据Q2财报电话会,24Q2由AI生成的百度搜索结果占比18%,相较于Q1的11%提高7个百分点。相比谷歌、微软等仅增加“AI生成内容”的搜索,百使用智能体重构AI搜索。智能体在百度生态的7月日均分发量超800万次,为5月的两倍。(2)百度文库:在大模型加持之下,百度文库从一款纯粹的“内容工具”转变为“生产力工具”,拥有智能PPT、智能文档等上百项多模态AI功能。24Q2百度文库的订阅收入同比增长超15%。目前百度文库累计AI用户数已突破1.8亿,AI功能使用次数已突破22亿次。(3)文心快码:目前百度80%的工程师已深度使用文心快码,百度30%的代码由文心快码生成。
阿里云“AI驱动,公共云优先”显成效。据财报数据,阿里云季度营收增长至265.49亿元人民币,同比增长6%。其中,AI相关产品收入实现三位数增长,公共云业务实现两位数增长。财报称,这一增长在于阿里云专注于公共云战略,并提升运营效率。阿里云已获明确认可为中国首选的用于AI训练和应用的云服务提供商,是在全球同业中唯一获提及来自亚洲的云服务提供者。阿里表示将继续对客户和技术进行投入,尤其是在AI基建方面,以提升AI领域的云采用量。此前,通义千问GPT-4级主力模型Qwen-Long的API输入价格降至1元200万tokens,仅为GPT-4价格的1/400。降价策略极大激发了阿里云AI产品的使用量,使得AI平台(百炼)的付费用户数在短短一个季度内增长超过200%。
腾讯持续推动AI与业务结合,包括游戏、元宝、广告等多个板块。(1)游戏业务:使用AI弥合PvE和PvP间的差距,通过AI技术加持,越来越多用户将参与到与机器对战的游戏当中。(2)广告业务:利用AI进行个性化推荐,提升转化率。受益于视频号广告、AI提效等因素,24Q2
广告实现营收299亿元,同比增长19%。(3)AI助手元宝:基于腾讯混元模型,腾讯在24Q2推出AI助手元宝。元宝允许用户以多种方式与大语言模型进行交互,如增强搜索功能可根据搜索结果为用户提供直接答案。(4)协作SaaS产品:企业微信、腾讯会议和腾讯文档等已全面接入腾讯混元大模型,加速智能化升级。
“讯飞星火”大模型持续推广落地,赋能公司核心业务增长。科大讯飞在推出“讯飞星火”后,几乎将其应用在了旗下所有业务中。24H1公司加快了大模型的落地推广力度,大模型对业务增长拉动明显。据公司8月22日公布的半年报,24H1公司实现营收93.25亿元,同比增长19%。分业务来看,教育产品和服务/医疗业务/开放平台/智能硬件/汽车业务分别实现营收28.60/2.28/23.45/9.00/3.5亿元,同比增速为25.14%/18.80%/47.92%/56.61%/65.49%。在AI投入方面,24H1公司在大模型研发、核心技术自主可控和产业链可控以及大模型产业落地拓展等方面新增投入超6.5亿元。目前,“讯飞星火”是全民可下载大模型中唯一基于全国产算力训练的大模型技术成果,其APP在安卓端的下载量已达到1.4亿次,在国内工具类通用大模型APP中排名第一。
二、数据中心算力
国内最大智算中心将于8月30日在哈尔滨投用,建议持续关注国产算力需求释放。中国移动黑龙江公司在哈尔滨智算中心共计部署1.8万张AI加速卡。该智算中心具有单集群算力规模最大、国产化网络设备组网规模最大、融合分级存储规模最大和国内智能融合分级存储规模最大的特点,可实现集群故障的分钟级定界定位,提供算力6.6EFLOPS,为万亿级模型训练提供高效、稳定的算力底座。
三、AI大模型跟踪
本周Runway和Midjourney访问量突破历史新高。据similarweb最新数据(0816-0822):(1)OpenAI和Gemini本周访问量均有所上升。8月21日,GPT-4o正式上线微调功能。同日,谷歌更新Gemini,用户可在免费版Gemini中访问1.5Flash,响应质量和速度全面提升。(2)豆包自8月8日推出一键写歌功能以来,访问量持续攀升。(3)Midjourney本周访问量增量明显。8月22日,Midjourney全面开放网站,附赠25次免费生成额度。8月21日,Ideogram2.0版本正式发布,图片生成质量和语义理解能力显著提升,同时支持中文提示。(4)Runway本周访问量达160万,突破历史新高。8月15日,Runway发布Gen-3AlphaTurbo图像转视频功能,生成效率比Gen-3Alpha快7倍,而价格仅为其一半,带动本周访问量上升。
传OpenAI“草莓”和猎户座(Orion)模型即将问世。据AIHub援引TheInformation报道,OpenAI计划最早今年秋季推出“草莓”推理AI模型。“草莓”主要用于解决复杂推理任务,可以解决以前从未见过的数学问题。猎户座作为现有旗舰大语言模型GPT-4的升级版,其预训练数据由草莓模型生成。此外,OpenAI正考虑将“草莓”的精简版本以聊天机器人的形态推向市场,以帮助降低成本。
浪潮源2.0-M32大模型量化版性能比肩LLaMA3-70B,Meta相继推出ImagineYourself&Sapiens大模型。(1)浪潮源2.0-M32大模型量化版:8月22日,浪潮信息发布源2.0-M32大模型4bit和8bit量化版,4bit量化版推理运行显存仅需23.27GB,处理每token所需算力约1.9GFLOPs,算力消耗仅为同等当量大模型LLaMA3-70的1/80。(2)AI图像模型ImagineYourself:8月23日,Meta发布ImagineYourself模型,无需为特定对象进行微调,在个性化图像生成领域取得突破。(3)AI视觉模型Sapiens:8月24日,Meta推出AI视觉模型Sapiens,该模型专注于解决包括二维姿态估计、人体部位划分、深度感知及表面法向量预测四大应用领域相关视觉任务。其模型参数规模覆盖3亿至20亿区间,具备原生1K高分辨率推理能力。
建议关注
国产算力链:寒武纪、海光信息、龙芯中科、盛科通信等。
数据中心硬件:中际旭创、工业富联、新易盛、天孚通信、沃尔核材、英维克、沪电股份、胜宏科技。
风险提示
技术发展及落地不及预期;下游终端出货不及预期;下游需求不及预期;市场竞争加剧风险;地缘政治风险。