开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >王炸！OpenAI全新模型GPT-4o推出！免费使用，实时语音视频交互来了！

王炸！OpenAI全新模型GPT-4o推出！免费使用，实时语音视频交互来了！

用户6070864

发布于 2024-05-18 08:30:53

1260

发布于 2024-05-18 08:30:53

举报

文章被收录于专栏：实时流式计算实时流式计算

北京时间5月14日凌晨，OpenAI 春季新品发布会举行，新一代旗舰生成模型 GPT-4o来了。GPT-4o 的推出代表着技术进步的一大步，集成了文本、语音和图像三种模态，使人机交互更加自然和高效。

这样的话，目前可以使用的版本包括了ChatGPT 4o，GPT-4，GPT-3.5这三种可以选择。

首先通过一张图片了解发布会的全部内容。

OpenAI推出了GPT-4o，这是一款能够实时处理和生成文本、音频和图像的新模型。GPT-4o具备快速响应能力，非英语语言处理能力显著提升，并且在音频和视觉理解方面表现出色。该模型将所有模态集成到一个神经网络中，减少了延迟并提高了效率。GPT-4o还加强了安全措施，并通过API供开发者使用。最初发布版本包括文本和图像功能，音频和视频功能将在未来推出。

以下是 GPT-4o 的主要特性：

多模态交互：

文本、音频和图像理解与生成：GPT-4o 能够同时处理和生成文本、音频和图像，极大地提高了模型的实用性。
实时响应：平均响应时间缩短至 320 毫秒，显著快于之前的模型，接近人类的响应速度。

增强的智能与情感理解：

自然互动：GPT-4o 不仅能够理解复杂的指令，还能表现出各种情感，提供更加人性化的交互体验。
实时语音对话：用户可以随时打断 AI 的话，不用等它说完，模型的反应速度超快。

视觉与代码能力：
- 视觉能力：GPT-4o 能够实时处理视觉信息，甚至可以教人解决数学题。
- 代码解释与生成：用户可以通过语音与 GPT-4o 互动，让它解释代码并生成相应的结果，例如温度曲线图。

提升的性能与多语言支持：
- 非英语文本处理：在多语言处理方面表现显著提升，尤其是在音频和视觉理解上表现卓越。
- 降低成本：API 速度更快，成本降低 50%。

最令人震撼的是，现在普通用户也可以使用GPT-4o账号了。这也是OpenAI免费战略的一部分，只是速度会受到限制，而Plus用户的限制会小很多。

本文参与腾讯云自媒体分享计划，分享自微信公众号。

原始发表：2024-05-14，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自大数据流动微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体分享计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

LV.

相关产品与服务

腾讯云小微

腾讯云小微，是一套腾讯云的智能服务系统，也是一个智能服务开放平台，接入小微的硬件可以快速具备听觉和视觉感知能力，帮助智能硬件厂商实现语音人机互动和音视频服务能力。

产品介绍产品文档