文章来源:放心AI网发布时间:2025-04-12 13:45:18
3月13日,Sesame公司推出其最新语音合成模型CSM,引发业界关注。据官方介绍,CSM采用端到端基于Transformer的多模态学习架构,能够理解上下文信息,生成自然且富有情感的语音,声音效果贴近真人,令人惊艳。
该模型支持实时语音生成,可处理文本和音频输入,用户还能通过调整参数控制语气、语调、节奏及情感等特性,展现高度灵活性。
CSM被认为是AI语音技术的重要突破。其语音自然度极高,甚至“无法分辨是人工合成还是真人”。有用户录制视频展示CSM几近无延迟的表现,称其为“体验过的最强模型”。此前,Sesame曾开源小版本CSM-1B,支持多轮对话生成连贯语音,获得广泛好评。
目前,CSM主要针对英语训练,表现优异,但在多语言支持上仍有限制。目前其不支持中文,但期待未来扩展。
Sesame表示将部分开源研究成果,社区开发者已在GitHub上热议其潜力。CSM不仅适用于对话式AI,还可能推动教育、娱乐等领域语音交互体验的革新。业内人士认为,CSM或将重塑AI语音助手标准,带来更自然的人机对话。
上一篇: OpenAIChatPlayground升级为PromptsPlayground更好测试、迭代提示词
OpenAI 宣布,其广受欢迎的 Chat Playground 正式升级并更名为 Prompts Playground。这一更新带来了全新的设计和功能,旨在为用户提供更强大的工具,以便更好地测试、比较和迭代提示(prompts)。根据 OpenAI 在
下一篇: Anthropic、IBM和Meta的技术领导者警告称,人工智能将取代软件开发人员的工作
在最近一次国际会议上,Anthropic 首席执行官达里奥・阿莫迪(Dario Amodei)发表了一个引人注目的预测,他认为人工智能将在未来三到六个月内承担90% 的代码编写工作。阿莫迪表示,如果这一趋势持续下去,到了12
相关攻略 更多
最新资讯 更多
AI语音独角兽ElevenLabs完成2.5亿美元C轮融资,估值突破30亿
更新时间:2025-04-29
百川智能推出国内首个全场景深度思考医疗大模型,革新医学推理方式
更新时间:2025-04-29
奥特曼加码长寿科技:RetroBiosciences欲筹10亿美元,挑战人类寿命极限
更新时间:2025-04-29
OpenAI新成立的PBC部门估值达300亿美元,微软投资股份尚未确定
更新时间:2025-04-29
扎克伯格表示,2025年底Meta将拥有130万个用于AI的GPU
更新时间:2025-04-29
德勤:企业在推行生成式AI项目上面临规模化挑战
更新时间:2025-04-29
AI基础设施争夺战愈演愈烈:OpenAI与微软的微妙关系
更新时间:2025-04-29
聊天机器人平台CharacterAI以第一修正案为由申请驳回与青少年自杀案的诉讼
更新时间:2025-04-29
Deezer日均上传超万首AI音乐,平台开始检测与标记
更新时间:2025-04-29
AI创业公司GameOn创始人与律师妻子被控6000万美元投资诈骗
更新时间:2025-04-29