OpenAI 今日宣布,高级语音模式已面向 ChatGPT Plus 用户和团队层级开放。这一新功能有望带来更自然、更接近人类的对话体验,增强用户互动。我们早就知道这即将到来,而 高级语音模式 的这一新进展标志着在改进对话式 AI 的语音交互方面迈出了重要一步。
高级语音模式利用新的 GPT-4o 模型,该模型结合了文本、视觉和音频处理,以实现更快、更高效的响应。与之前的版本不同,用户现在可以体验实时、情感响应式的对话,提供动态的语音模式,并且 AI 甚至可以轻松处理中断。这一新进展表明,OpenAI 继续为更顺畅的交互铺平道路,因为它引领了基于语音的 AI 技术的发展,尽管它有来自 Gemini Live 的竞争。
ChatGPT Plus 用户可以期待体验到增强的个性化功能,包括定制的指令和更出色的记忆,让每次交互都更具个性化,更贴合用户需求。这些额外功能能确保人工智能适应个人的对话喜好,让每次会话更直观、更自然。
在这次新的推广中,OpenAI 除了当前的标准和高级语音模式版本外,还推出了五种新的语音模式。这些新的语音选项让用户能够掌控他们与人工智能的交互方式。
此次更新目前仅面向 ChatGPT Plus 用户和团队用户,但很快还会进一步拓展至企业订阅用户。从下周起,美国的订阅用户就能使用了,但欧盟、英国、瑞士、冰岛以及挪威的用户则需要等待更久,直到这些功能在他们所在的地区能够使用。