OpenAI 近日宣布为 ChatGPT Plus 和 Team 计划的付费用户推出全新的高级语音模式(Advanced Voice Mode,简称 AVM)。这一重大更新不仅带来了更自然的交互体验,还引入了多项个性化功能,进一步提升了 AI 语音助手的实用性。
高级语音模式的核心亮点在于其类似真人的互动能力。用户可以随时打断对话,而系统能够感知并回应用户的情绪波动,从而实现更加深入和自然的对话。这意味着用户与 ChatGPT 的交流将不再局限于简单的问答,而是能够进行更加丰富和有意义的沟通。
在语音风格方面,此次更新引入了五种全新的选项:Vale、Spruce、Arbor、Maple 和 Sol。同时,高级语音模式还支持包括中文在内的 50 多种语言,并且提高了部分外语的对话速度、流畅度,以及改进了口音表现。
为了提供更加个性化的体验,OpenAI 还为高级语音模式增加了两项重要功能。首先,用户可以为语音助手存储 “自定义指令”,以便根据个人需求定制 AI 的行为模式。其次,系统新增了 “记忆”功能,能够记住用户希望语音助手表现的特定行为,这与今年 4 月 OpenAI 为 ChatGPT 文本版本推出的记忆功能类似。通过这些功能,用户可以确保语音模式根据他们的偏好做出个性化响应。
值得注意的是,这些更新仅适用于 OpenAI 的 AI 模型 GPT-4o,不包括最近发布的预览模型 o1。高级语音模式将在未来几天内逐步推出,首先在美国市场上线。当用户通过移动应用访问高级语音模式时,系统会通过弹出窗口和通知提醒用户已进入高级语音助手模式。
资料来源:综合报道;图片来源:OpenAI 官方 X 平台