文章来源:放心AI网发布时间:2025-04-17 17:17:56
在快速发展的播客领域,Podcastle 平台近日宣布推出其全新的 AI 文本转语音模型 Asyncflow v1.0。这个新模型不仅为用户提供了超过450种不同的 AI 语音,还向开发者开放了 API 接口,以便于他们将这一文本转语音功能直接集成到自己的应用程序中。
Podcastle 的创始人 Arto Yeritsyan 表示,公司一直希望能开发一个文本转语音模型,但由于过去高昂的训练成本和数据需求,这一愿望一直未能实现。然而,随着近年来大型语言模型技术的进步,Podcastle 终于在去年取得了突破,能够在不需要大量数据的情况下,构建出高质量的语音模型。Yeritsyan 补充道,Podcastle 的研发得到了去年1350万美元的 A 轮融资的支持,这为其技术创新提供了重要保障。
在价格方面,Podcastle 的文本转语音服务定价为每500分钟约40美元,相比之下,竞争对手 ElevenLabs 则收取99美元。除了文本转语音模型外,Podcastle 的语音克隆功能也得到了升级,训练过程由之前的需朗读70句不同句子,缩短至现在仅需几秒的录音。新过程利用了 Podcastle 去年推出的 Magic Dust AI 技术,显著提高了音频录制质量。
在实际测试中,尽管新生成的语音听起来稍显机器人,但仍能较好地模仿说话者的语调。Podcastle 表示,随着时间推移,该功能将不断改进,用户也可以通过不同的录音样本训练出不同的声音效果。
Yeritsyan 指出,除了成本优势外,将音频、视频、播客和 AI 驱动的叙述工具整合到一个重新设计的网站中,也将使 Podcastle 在竞争中脱颖而出。他提到,虽然大多数用户仍主要使用 Podcastle 进行音频内容创作,但视频制作的需求也在逐渐上升。
入口:https://podcastle.ai/ai-voices
相关攻略 更多
最新资讯 更多
播客平台Podcastle推出AI文本转语音模型:提供450种语音
更新时间:2025-04-17
三星GalaxyS25系列国行版接入DeepSeek-R1:AI能力全面升级
更新时间:2025-04-17
亚马逊的AGI负责人表示,AI已深入每个业务角落
更新时间:2025-04-17
火山引擎宣布大模型应用开源:上线“大模型应用实验室”,释放AI创新潜力
更新时间:2025-04-17
颠覆城市建模!AI生成3D城市模型GaussianCity,生成速度提升60倍!
更新时间:2025-04-17
周鸿祎谈AI幻觉与网络安全:问题不可夸大也不应忽视
更新时间:2025-04-17
超强视频生成模型Wan2.1GP:低配GPU也能搞定大片!
更新时间:2025-04-17
智谱发布首个能生成汉字的开源文生图模型CogView4
更新时间:2025-04-17
智谱开源文生图模型CogView4,支持中英双语提示词输入
更新时间:2025-04-17
中文开源图片模型终于来了!智谱霸气发布CogView4:中文prompt随便喂,汉字都能给你画出来!
更新时间:2025-04-17