通义千问2.5震撼发布,中文大模型再攀高峰,传媒行业迎来新变革!
投资要点
热点事件:5月9日,阿里云正式发布通义千问2.5,中文性能全面赶超GPT-4Turbo,成为目前最强中文大模型。同时,通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。国内大模型持续迭代突破,对标海外顶尖技术,或深度赋能国内AI生态,长效赋能商业落地和内容创作。
通义千问2.5强势追赶GPT-4Turbo,中文大模型迭代突破。过去一年多里,在激烈而又多变的行业竞争态势中,通义千问坚持基础模型技术研发路线。从通义千问2.1至通义千问2.5,最新版本大模型在理解能力方面提升了9%、在逻辑推理方面提升了16%、在指令遵循方面提升了19%,在代码能力领域亦实现了10%的提升。据权威基准OpenCompass测评结果显示,通义千问2.5得分追平GPT-4Turbo,是该基准首次录得国产大模型取得此等佳绩。目前,其开源模型下载量已经超700万。国内开源大模型再创佳绩,持续推动大模型开源风潮,极大推进应用落地进程,赋能创新性开发和内容生产。
Qwen1.5-110B发布,开源领域实现强势赶超。1100亿参数开源模型Qwen1.5-110B在MMLU、TheoremQA、GPQA等基准测评中超越Meta的Llama-3-70B,在HuggingFace开源大模型排行榜OpenLLMLeaderboard上进入榜首,展现其在开源领域极强的竞争力。为顺应不同场景用户需求,通义已推出参数规模横跨5亿到1100亿的8款大语言模型。0.5B、1.8B、4B、7B、14B等小尺寸模型可便捷地在手机、PC等端侧设备部署;中等尺寸如32B则试图在性能、效率和内存占用之间找到最具性价比的平衡点;72B、110B等大尺寸模型则支持企业级和科研级应用。其中,多款产品曾在OpenLLMLeaderboard榜单实现登顶,在开放研究机构LMSYSOrg推出的基准测试平台ChatbotArena上位居Top10。中文大模型坚持开源路线,利好国内AI生态,本地化AI加持更有利于加速商业化,赋能内容发展。
通用领域持续迭代催化,赋能垂类应用发展。5月9日,小米旗下AI助手“小爱同学”与阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态AI生成能力,并在小米汽车、手机等多类设备落地;此外,微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。AI落地进行时,看好通用模型赋能下AI加速落地。
持续关注大模型赋能AI商用落地。建议关注:昆仑万维、天娱数科、因赛集团、蓝色光标、天下秀、美图公司、天娱数科、世纪天鸿、元隆雅图、视觉中国、顺网科技、中文在线、巨人网络、恺英网络、捷成股份、值得买、返利科技等。
风险提示:政策不确定性、AI应用落地不及预期、版权授权潜在争议风险等。