OpenAI推出带视觉的先进语音模式,开启ChatGPT实时视频交互新纪元
繁简切换

FX168财经网>合作>正文

OpenAI推出带视觉的先进语音模式,开启ChatGPT实时视频交互新纪元

文 / 第三方供稿 来源:第三方供稿

OpenAI推出实时视频和视觉功能,ChatGPT迎来重大更新

实时视频功能上线

根据TodayUSstock.com报道,OpenAI终于推出了其七个月前展示的实时视频功能,现已为ChatGPT增加了视觉功能。用户可以通过手机对准物体,ChatGPT将实时做出回应,增加了视觉理解能力。

带视觉的语音模式介绍

带视觉的先进语音模式是OpenAI新推出的一项功能,它不仅可以处理语音输入,还能理解图像和视频中的信息。用户通过该模式可以获得更为直观的交互体验。

应用场景与展示

在直播演示中,OpenAI展示了带视觉的语音模式如何理解用户手机屏幕上的内容,甚至可以帮助解决数学问题或者指导设备的设置。用户可通过点击语音图标和视频图标来启动该功能。

竞争对手与市场动态

Google和Meta等竞争对手也在开发类似的功能。Google本周推出了其实时视频分析功能“Project Astra”,并向安卓用户中的“受信任测试员”开放。

编辑总结

OpenAI推出的带视觉的先进语音模式标志着ChatGPT在交互性上的重大进步,虽然该功能尚存在一定的误差,但其潜力巨大。预计随着更多用户体验和技术的完善,该功能会在未来得到进一步优化。

名词解释

  • 实时视频功能:指通过视频流处理和理解视觉信息,允许AI在观看视频或实时图像的基础上进行交互。

  • 带视觉的先进语音模式:OpenAI推出的新增功能,结合语音和视觉,增强了ChatGPT的理解和互动能力。

  • Project Astra:Google开发的实时视频分析AI功能,目前在安卓平台向部分用户开放。

今年相关大事件

  • 2024年12月:OpenAI正式推出带视觉的先进语音模式,用户可以通过手机视频或屏幕共享与ChatGPT进行互动。

  • 2024年11月:Google发布Project Astra的测试版本,开始在安卓平台进行有限测试。

来源:今日美股网

分享
掌握最新全球资讯,下载FX168财经APP

相关文章

48小时/周排行

最热文章