投资实习所 前天 17:43
AI对话技术进展与行业应用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

随着人工智能的飞速发展,AI语音交互正成为一种重要的未来界面。Cartesia公司近期完成了1亿美元融资,并发布了先进的实时对话模型Sonic-3,该模型具备出色的自然感和低延迟,支持42种语言,并基于状态空间模型(SSM)构建,能更有效地记忆对话上下文,而非Transformer模型需要重复回顾。目前,Sonic已被数千家企业广泛应用于客服和笔记等场景。AI客服和笔记应用的普及,以及Cluely等工具在实时会议智能方面的创新,都印证了市场对高效语音AI的需求。此外,AI聊天进行客户研究的新模式也获得了巨额投资,通过模拟大量深度用户访谈,极大地提升了信息获取效率,并实现了传统人工工作的自动化。

💡 **AI语音交互的革新**: Cartesia推出的Sonic-3模型,基于状态空间模型(SSM)而非Transformer架构,显著提升了对话的自然度和效率。其低延迟(端到端190ms)和对42种语言的支持,使其在实时对话场景中表现出色,能够像人类一样“记住”对话的主题和氛围,避免了Transformer模型需要反复回顾上下文的弊端,为下一代人机交互界面奠定了基础。

📈 **AI在商业场景中的广泛应用**: Sonic模型已被Servicenow、Cresta和Decagon等数千家企业应用于每月数百万次对话,尤其是在AI客服和AI笔记领域,市场需求强劲。Cluely等工具的转型和创新,如提供实时会议智能,而非仅在会后生成总结,进一步展示了AI在提升会议效率和处理复杂对话方面的巨大潜力。

💰 **AI驱动信息获取的新模式**: 通过与AI聊天来获取信息已成为一种新的趋势,尤其在客户研究领域。相关AI产品通过模拟大规模深度用户访谈,能够在数小时内完成数百甚至上千次访谈,极大地提高了信息收集的效率,并实现了传统需要大量人工处理工作的自动化,为企业决策提供了有力支持。

🌐 **语音AI的长期愿景与投资热潮**: a16z和Sequoia等顶级投资机构对语音AI硬件和交互界面的长期愿景进行了巨额押注。Genspark等华人语音AI公司也取得了显著成就,ARR(年经常性收入)超过5000万美元,估值达到10亿美元,这表明市场对语音AI技术的未来发展充满信心,并愿意为之投入巨资。

原创 StartupBoy 2025-11-03 13:38 广东

在一个 AI 越来越多地做出决策的世界里,理解真实人类的需求、欲望和痛点变得比以往任何时候都更加重要

AI 语音的发展,不仅正在改变很多行业,很可能会成为未来非常重要的一种新的交互界面。模型层面,Cartesia 前几天宣布从 KP、Index、Lightspeed 和英伟达等完成了 1 亿美金的融资,并推出了最先进的实时对话模型 Sonic-3。

Sonic-3 具有很好的自然感,模型延迟在 90ms,端到端 190ms,支持 42 种语言。而且它是基于状态空间模型 (SSM) 而不是 Transformer 进行构建的。

Cartesia 说,都在用的 Transformers 就像在说每个新单词之前,都要从头开始重温整个对话,每一个单词都需要回顾所有内容。

而 SSM(Sonic-3 所使用的)就像人类一样,能够记住对话的主题和氛围。有足够的上下文信息,无需重放所有内容就能自然地进行交流。目前像 ServiceNow、Cresta 和 Decagon 等数千家企业每月使用 Sonic 进行数百万次对话。

应用层面,大量 AI 客服以及各种 AI 笔记应用的快速渗透《红杉中国领投 Genspark 估值 10 亿美金,又一华人语音 AI ARR 超 5000 万美金》,已经能感受到市场的需求。

就连之前引发了巨大争议的 Cluely,前几天也宣布转型为了一个 AI 笔记应用,其创始人 Roy 因开发 AI 作弊工具被退学,后拿到 a16z 1500 万美金融资和激进的营销方式而走红。

Cluely 声称与其他类似产品在会议结束后才发挥作用的常规 AI 会议记录工具不同,Cluely在通话过程中提供实时会议智能。其他 AI 会议助手在会后生成会议总结,而 Cluely 则帮助你回答技术问题、处理异议,并在高风险对话中表现得更好。

a16z 和 Sequoia 重金押注的这个语音 AI《Benchmark 加入一位新 GP,a16z 和红杉巨额投了一个语音 AI 硬件》,其长期愿景也是通过语音 AI 和硬件载体来打造新的交互界面。

而我之前介绍过的通过与 AI 聊天来进行招聘的这种新方式《AI 招聘新方式:跟 AI 聊天。种子轮就拿了 2000 万美金》,也开始延伸到其他行业。

其中将这个方式应用到客户研究的 AI 产品,已经连续完成了 3 轮近 1 亿美金,其核心也是直接通过与 AI 的聊天对话来获取信息。

它能让企业在几小时内完成数百甚至上千次深度用户访谈。除此之外,它还将传统需要大量人工处理的工作自动化了,比方说……

共 2386 

后续内容为付费会员专属,会员扫码登录直接阅读

Memo: Signal, not noise!

扫码或点击「阅读原文」继续阅读

订阅 Memo Pro

Memo(vcsmemo.com)是一个基于付费订阅模式的创投内容平台,已得到大量 VC、企业 CEO 以及高管的支持,我们希望帮助你捕捉最具价值的行业信号、过滤噪音(Signal,Not Noise)。

订阅 Memo Pro你将获得:

1.解锁未来一年以及之前的所有会员专属内容

2.邮件订阅功能:付费内容+最新行业快讯+...

3.优先体验 Memo 新产品和新功能

4.后台回复“发票”获得开票入口

限时 799 元/年(原价 999 元/年),扫码立即订阅

1.AI 招聘新方式:跟 AI 聊天。种子轮就拿了 2000 万美金

2.Benchmark 加入一位新 GP,a16z 和红杉巨额投了一个语音 AI 硬件

3.红杉中国领投 Genspark 估值 10 亿美金,又一华人语音 AI ARR 超 5000 万美金

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI语音 对话模型 Cartesia Sonic-3 SSM Transformer AI客服 AI笔记 实时会议 客户研究 语音AI AI交互界面 VC投资
相关文章