OpenAI发布语音模型GPT
OpenAI正式发布语音模型GPT-realtime。发布
据介绍,语音GPT-realtime是模型一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的发布语音,精准还原人类语调、语音情感和语速的模型丰富变化。该模型支持图像理解,发布并可结合语音或文本对话使用,语音非常适合应用于客服、模型教育、发布金融、语音医疗等领域,模型用于构建高质量的发布语音智能体。
官方表示,语音新模型在复杂指令遵循、模型工具精确调用以及生成更自然、更具表现力的语音方面表现卓越。尤其在重复字母与数字、逐字朗读免责声明、语句间无缝切换语言等场景中,GPT-realtime展现出优秀的适应能力。
该模型还具备出色的上下文理解能力,可准确捕捉非语言线索(如笑声),并实时调整语音语气,实现诸如“带法国口音的友好语调”或“语速较快的专业语调”等多样化表达。
此外,GPT-realtime新增了“Cedar”和“Marin”两种语音风格,并对现有八种语音效果进行了全面优化。
本文地址:https://www.xxxfeast.com/news/19e6999911.html
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。