美国11家voice agent大盘点
很明显AI语音已经进入到第二阶段了
最近OpenAI发布GPT-Realtime语音模型,微软发布了MAI-Voice-1语音模型,混元也发布了HunyuanVideo-Foley视频音效生成模型,不出意外,语音模型也成了巨头大厂的兵家必争之地。
现在的语音模型,更低延时,效果更逼真。当语音模型越来越好,voice agent就会迎来爆发,特别是很多传统行业,高频对话场景的,可以用voice agent重新做一遍,毕竟,人与人的沟通方式,第一是语言,第二就是语音了。
很明显,语音agent到目前为止分为两个阶段,第一阶段是Synthflow和Bland包括转型前的Retell,都是只提供方案。第二阶段的voice agent不再是提供方案,而是提供全流程服务,从卖方案转变为卖人,也就是提供数字员工,最终实现取代人力的低成本交付。
三个分析维度,细分领域,高频对话场景,全流程闭环
1.针对传统行业细分场景的voice agent
客服场景,Sierra
呼叫中心场景,Retell
求职场景,Dex
租房场景,Elise
卖车场景,Toma
市场调研场景,listen labs
专家访谈场景,Ethos
车贷场景,Salient
物流场景,HappyRobot
2.AI应用加入语音功能
Decagon,之前是语言客服,现在是语音客服。
Outset,AI调研工具,之前是基于文字,现在是多模态,可以做语音和视频访谈。
3.语音自动化处理全流程,实现商业闭环,AI价值更可量化
Salient除了用语音处理贷款催收,还覆盖客服和合规监控等一系列流程。
Toma帮助汽车经销商处理客户预约、订单还有销售咨询等一系列流程。
Elise从租赁咨询、协调安排看房时间到自动处理维修申报、续约谈判甚至催缴欠款。
listen labs从用AI语音招募受访者、主持访谈到自动生成报告。
Ethos从寻找专家到预约会议,再到转录,再到出分析报告,实现端到端交付。
Dex用AI语音和求职者对话,除了了解求职者经验、技能和职业规划之外,还帮助规划职业发展、推荐工作机会、准备面试,薪资谈判。
Sierra不仅是语音客服回答,还可以执行退款、订单修改、更新物流进度等操作。
HappyRobot不仅是AI接打电话,还可以匹配供需双方,安排运输任务,以及车辆实时跟踪。