GPT-4o震撼发布,聚焦强交互场景应用新纪元!
行业事件:
北京时间5月14日凌晨,美国人工智能公司OpenAI发布新一代旗舰生成模型GPT-4o、桌面App,并重点展示了突破性的语音交互能力。
GPT-4o交互能力实现突破,“拟人化”程度进一步提升
从产品效果来看,GPT-4o在实时语音交互领域实现突破性进展,为用户提供更为自然、准确的交互体验:1)用户可以随时打断模型,而不需要等到其结束才开始说话,交互更加符合人类交互逻辑;2)实时响应能力大幅提升,模型具有实时响应的能力,不会出现用户长时间等待模型给出响应的尴尬情况;3)模型具有情绪感知能力,能够生成不同情绪风格的语音,交互更加拟人。基于GPT-4o强大的交互能力,发布会中展示了丰富的应用场景,包括声情并茂地讲情感故事、实时视频对话、实时音频翻译等。从技术层面看,GPT-4o采用了全新技术,所有的输入和输出都由同一个神经网络处理,从而实现文本、视觉和音频端到端的训练。
AIC端应用有望加速落地,重点关注社交、游戏、教育领域2024年以来,多模态能力成为生成式AI的重点攻坚方向,而OpenAI作为头部企业,在技术和产品层面持续引领行业发展。2024年2月OpenAI发布Sora以来,海内外视频生成类应用加速落地。我们认为此次GPT-4o的发布,亦有望助推语音交互类AI应用的落地进程,其中在社交、游戏、教育领域有望率先落地。
1)社交:目前,AI+社交产品形态多以“用户-AI智能体”交互为主,用户通过与个性化AI虚拟人的交互过程,获得陪伴感与情绪价值。从产品数据来看,海外头部产品Character.AI月活达千万级别,国内Minimax旗下“星野”增势显著。从落地门槛来看,陪伴类场景的任务简单、容错率高,因此成为最快落地的AIC端应用场景。从用户需求来看,AI智能体“更像人”是AI社交用户的核心需求。GPT-4o发布后,有望从多模态(从文字交互到语音交互)、拟人化(更准确识别用户的情绪和需求)等方面大幅提升用户体验,从而推动AI社交类产品进一步破圈、提升商业化能力。
2)游戏:AI在游戏研发流程中落地较快,目前核心关注游戏玩法的创新。其中AI+NPC已在网易《逆水寒》等产品中落地,但仅限于文字类交互,与核心玩法的结合也较为有限。随着GPT-4o引领交互方式变革,游戏内NPC有望与用户实现实时的语音交互、拟人化程度有望进一步提升,大幅提升用户的沉浸感,进而提升活跃度及付费意愿。
3)教育:此前,海外多邻国等已将生成式AI运用于口语练习等场景中,助推2023Q4付费用户同比增长57%。GPT-4o落地后有望使“AI教师”更为拟人,进一步提升教学、培训效率和用户体验。
投资建议
随着海外AI模型能力加速演进,以及国内模型能力的持续追赶,2024年以来国内AIC端应用落地进程显著加速,有望孵化AI原生的“杀手级应用”。建议关注:1)AIC端应用落地较快的昆仑万维、盛天网络;2)估值低位、业绩较优的游戏标的恺英网络、巨人网络。
风险提示:技术发展不及预期,AI应用落地不及预期,政策监管风险。