编码人声:GPT-4o 只是对话式 AI 的冰山一角,背后隐藏了哪些新机会?

脱口秀 津津乐道播客 第580期 2024-06-12 创建 播放:1489

介绍: GPT-4o 只是「对话式 AI 」(conversational AI) 的冰山一角。
同期发布的 Project Astra 还演示了对话式 AI 和可穿戴硬件结合的可能。
更早些,hume.ai 上线了能解读 53 种不同情绪的「共情语音接口」(EVI),发布了一档实时交互式 AI 播客。
ChatTTS 让更多人体验到会笑会停顿,几乎与真人无异的语音合成技术。
投资机构 a16z 近期...

介绍: GPT-4o 只是「对话式 AI 」(conversational AI) 的冰山一角。
同期发布的 Project Astra 还演示了对话式 AI 和可穿戴硬件结合的可能。
更早些,hume.ai 上线了能解读 53 种不同情绪的「共情语音接口」(EVI),发布了一档实时交互式 AI 播客。
ChatTTS 让更多人体验到会笑会停顿,几乎与真人无异的语音合成技术。
投资机构 a16z 近期发布报告,创立了「Voice AI Agent」的投资新赛道并高呼:「是时候重新发明通话了!」
技术上实现 《Her》 的「最后一步」是什么?创业者如何利用现有技术能力满足用户?哪些场景最可能诞生真实付费需求?
本期节目,嘉宾将从模型开发者、实时互动从业者、AI 陪伴玩具创业者的不同视角,探讨「对话式 AI」的边界,分享实践中看到的新机会。
有嘉宾说:人工智能实现 human like 的最后一步,是允许 AI 与人类拥有平等地位:如果你希望 AI 像人,那就请允许 AI 可以随时地回应你也打断你,聆听你也忽略你……
如果是这样,你愿意吗?

  • 音乐开放平台
  • 云村交易所
  • X StudioAI歌手
  • 用户认证
  • AI 免费写歌
  • 云推歌
  • 赞赏

廉正举报 不良信息举报邮箱: 51jubao@service.netease.com

互联网宗教信息服务许可证:浙(2022)0000120 增值电信业务经营许可证:浙B2-20150198 粤B2-20090191-18  浙ICP备15006616号-4  工业和信息化部备案管理系统网站

网易公司版权所有©1997-2025杭州乐读科技有限公司运营:浙网文[2024] 0900-042号 浙公网安备 33010802013307号 算法服务公示信息