AI界重磅:Open AI推出GPT-4,人机交互迎来全新里程碑!
事件:
5月14日凌晨(美国东部时间5月13日),OpenAI举办春季产品发布会,发布多模态大模型GPT-4o,其模型拥有实时跨文本、音频、视觉(包括图像和视频)的集成处理能力。
点评:
OpenAI发布GPT-4o,人机交互实现再突破。OpenAI在春季发布会中推出多模态大模型GPT-4o,主要亮点包括:1)GPT-4o可输入或输出文本、音频和图像任何组合;2)GPT-4o在实时语音对话方面实现重大突破。此前GPT-3.5和GPT-4在语音模式下存在明显的延迟现象,平均延迟时间分别为2.8秒和5.4秒,而GPT-4o对用户语音输入的响应时间缩短至232毫秒,接近人类在日常对话中的反应时间,对话流畅度方面远超同类产品;3)GPT-4o的语音对话功能可根据用户需求提供多样化的语气选项,涵盖从夸张戏剧到冰冷机械等的各种风格,可满足不同应用场景的对话需求。GPT-4o多模态效果表现显著,有望在广告营销、游戏、教育等领域实现广阔的应用前景。
多项性能提升驱动内容生产端加速发展。技术层面,GPT-4o在多个关键测试中均取得了显著的性能提升,包括文本评估、多语言处理、语音识别、语音翻译以及视觉理解等方面。其中,GPT-4o在零样本的COTMMLU(常识问题)上创造了88.7%的新高分。应用端方面,对于B端用户,GPT-4o的速度提升到了GPT-4Turbo的2倍,极大地提高了内容开发的效率。同时,其API定价降低至
GPT-4Turbo的一半,有效降低内容开发者的创作成本,进一步降低了创作门槛。此外,GPT-4o还将提供桌面版应用,为内容创作者提供一个更加固定、方便的工具入口,使创作过程更加流畅和高效。对于C端用户,GPT-4o将向用户免费开放(发送消息数量有限额)。
投资策略:GPT-4o多模态效果表现突出,且调用价格下降,有望进一步加快AI大模型在广告营销、游戏、教育等领域的应用。建议关注AI应用布局的公司,相关标的包括有神州泰岳(300002.SZ)、完美世界(002624.SZ)等。
风险提示:政策监管风险;AI技术发展不及预期风险;行业竞争加剧风险等。