ChatGPT 获得声音：OpenAI 推出高级语音模式

2024年8月1日

ChatGPT 获得声音：OpenAI 推出 GPT-4o 高级语音模式

OpenAI 推出了一项革命性的新功能，为聊天机器人领域带来了一场变革：ChatGPT 高级语音模式。该模式为交互带来了无与伦比的真实感，并由 GPT-4o 的强大功能提供支持。

对话式人工智能的新时代：

机械、单调的回应时代已经一去不复返。GPT-4o 是一种多模式模型，它无缝结合了文本和语音处理，无需单独的模型，从而实现更流畅、更自然的对话流程。这意味着更少的延迟和真正引人入胜的体验。

感受情感：

ChatGPT 的新语音不仅清晰度高，还能理解情绪。GPT-4o 可以检测出你声音中的细微差别，捕捉到悲伤、兴奋甚至歌唱等情绪！

目前数量有限：

虽然这项令人兴奋的功能正在推出，但它最初仅通过 Alpha 版本向部分 ChatGPT Plus 用户开放。OpenAI 计划在今年秋季之前将访问权限扩大到所有 Plus 用户。初始版本不包括今年早些时候展示的视频和屏幕共享等功能；这些功能将在稍后推出。

语音选项：

ChatGPT 的高级语音模式提供四种预设声音：Juniper、Breeze、Cove 和 Ember，每种声音都是与付费配音演员合作创建的。之前演示的 Sky 声音不再可用。

道德考虑：

OpenAI 深知负责任的 AI 开发的重要性，强调 ChatGPT 无法模仿特定个体的声音，并已实施过滤器以防止生成受版权保护的音频内容，从而降低法律风险。

安全第一：

OpenAI 已与一群使用多种语言的外部“红队”成员进行了广泛的测试。一份详细介绍这些安全措施的报告将于 8 月初发布。

这无疑是对话式人工智能向前迈出的重要一步，让我们更接近真正像人类一样与技术互动。请继续关注更多更新，因为 OpenAI 将继续完善和扩展这一突破性功能。