ChatGPT 获得声音:OpenAI 推出高级语音模式

ChatGPT 获得声音:OpenAI 推出 GPT-4o 高级语音模式

OpenAI 推出了一项革命性的新功能,为聊天机器人领域带来了一场变革:ChatGPT 高级语音模式。该模式为交互带来了无与伦比的真实感,并由 GPT-4o 的强大功能提供支持。

对话式人工智能的新时代:

机械、单调的回应时代已经一去不复返。GPT-4o 是一种多模式模型,它无缝结合了文本和语音处理,无需单独的模型,从而实现更流畅、更自然的对话流程。这意味着更少的延迟和真正引人入胜的体验。

感受情感:

ChatGPT 的新语音不仅清晰度高,还能理解情绪。GPT-4o 可以检测出你声音中的细微差别,捕捉到悲伤、兴奋甚至歌唱等情绪!

目前数量有限:

虽然这项令人兴奋的功能正在推出,但它最初仅通过 Alpha 版本向部分 ChatGPT Plus 用户开放。OpenAI 计划在今年秋季之前将访问权限扩大到所有 Plus 用户。初始版本不包括今年早些时候展示的视频和屏幕共享等功能;这些功能将在稍后推出。

语音选项:

ChatGPT 的高级语音模式提供四种预设声音:Juniper、Breeze、Cove 和 Ember,每种声音都是与付费配音演员合作创建的。之前演示的 Sky 声音不再可用。

道德考虑:

OpenAI 深知负责任的 AI 开发的重要性,强调 ChatGPT 无法模仿特定个体的声音,并已实施过滤器以防止生成受版权保护的音频内容,从而降低法律风险。

安全第一:

OpenAI 已与一群使用多种语言的外部“红队”成员进行了广泛的测试。一份详细介绍这些安全措施的报告将于 8 月初发布。

这无疑是对话式人工智能向前迈出的重要一步,让我们更接近真正像人类一样与技术互动。请继续关注更多更新,因为 OpenAI 将继续完善和扩展这一突破性功能。

返回博客

发表评论