前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >王炸!OpenAI全新模型GPT-4o推出!免费使用,实时语音视频交互来了!

王炸!OpenAI全新模型GPT-4o推出!免费使用,实时语音视频交互来了!

作者头像
用户6070864
发布2024-05-18 08:30:53
1260
发布2024-05-18 08:30:53
举报
文章被收录于专栏:实时流式计算实时流式计算

北京时间5月14日凌晨,OpenAI 春季新品发布会举行,新一代旗舰生成模型 GPT-4o来了。GPT-4o 的推出代表着技术进步的一大步,集成了文本、语音和图像三种模态,使人机交互更加自然和高效。

这样的话,目前可以使用的版本包括了ChatGPT 4o,GPT-4,GPT-3.5这三种可以选择。

首先通过一张图片了解发布会的全部内容。

OpenAI推出了GPT-4o,这是一款能够实时处理和生成文本、音频和图像的新模型。GPT-4o具备快速响应能力,非英语语言处理能力显著提升,并且在音频和视觉理解方面表现出色。该模型将所有模态集成到一个神经网络中,减少了延迟并提高了效率。GPT-4o还加强了安全措施,并通过API供开发者使用。最初发布版本包括文本和图像功能,音频和视频功能将在未来推出。

以下是 GPT-4o 的主要特性:

多模态交互:

  • 文本、音频和图像理解与生成:GPT-4o 能够同时处理和生成文本、音频和图像,极大地提高了模型的实用性。
  • 实时响应:平均响应时间缩短至 320 毫秒,显著快于之前的模型,接近人类的响应速度。

增强的智能与情感理解:

  • 自然互动:GPT-4o 不仅能够理解复杂的指令,还能表现出各种情感,提供更加人性化的交互体验。
  • 实时语音对话:用户可以随时打断 AI 的话,不用等它说完,模型的反应速度超快。

  1. 视觉与代码能力:
    • 视觉能力:GPT-4o 能够实时处理视觉信息,甚至可以教人解决数学题。
    • 代码解释与生成:用户可以通过语音与 GPT-4o 互动,让它解释代码并生成相应的结果,例如温度曲线图。
  1. 提升的性能与多语言支持:
    • 非英语文本处理:在多语言处理方面表现显著提升,尤其是在音频和视觉理解上表现卓越。
    • 降低成本:API 速度更快,成本降低 50%。

最令人震撼的是,现在普通用户也可以使用GPT-4o账号了。这也是OpenAI免费战略的一部分,只是速度会受到限制,而Plus用户的限制会小很多。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-05-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据流动 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云小微
腾讯云小微,是一套腾讯云的智能服务系统,也是一个智能服务开放平台,接入小微的硬件可以快速具备听觉和视觉感知能力,帮助智能硬件厂商实现语音人机互动和音视频服务能力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档