当前位置：首页 » 资讯 » 新科技 » 正文

持续聚焦RTE+AI 声网斩获2024人工智能年度评选两项大奖

IP属地北京 编辑：唐云泽砍柴网 时间：2024-12-16 11:31:21

12月11日,由量子位举办的MEET2025智能未来大会在北京圆满落幕,大会也同步公布了2024人工智能年度评选,声网凭借在 RTE+AI 领域的杰出探索,荣膺2024人工智能年度领航企业、2024人工智能年度杰出解决方案两项大奖。
本次评选于今年9月启动,在3个月时间里,共有数百家企业、机构和个人报名参与评选。最终,以真实数据为基础,结合量子位对数百家 AI 公司的深入调研,以及数十位行业知名专家的意见,得出最终榜单结果。
在Gen AI 的浪潮下,实时多模态成为大势所趋,声网作为全球实时互动云行业的开创者,在音视频领域积累了深厚的技术优势与场景实践,通过将 RTE 与生成式AI 结合,推出了声网 Conversational AI Agents ,该方案以语音为核心,支持视频扩展,实现文本/音频/图像/视频的组合输入&输出,具备500ms超低延时、对话更自然拟真、框架灵活可拓展等一系列特性,帮助开发者与企业快速构建适配自己业务场景的 AI 实时语音对话服务。
AI语音对话延迟低至 500ms 支持智能打断
超低延时语音对话是声网 Conversational AI Agents 解决方案的一大核心优势,通过在客户端进行低延迟的音频采集和播放,借助声网自研的 SD-RTN™ 实时传输网络实现全球范围的低延时 RTC 传输,语音对话延迟低至 500ms,并进一步通过更快速的 LLM 推理首字耗时、低延迟流式 TTS、同机部署等一系列技术手段,保证对话的实时性与流畅性,达到近似人与人之间日常对话停顿与间隔。
在真实的语音对话中,打断对方并提出新疑问是很常见的现象,而在 Gen AI 场景,能否支持随时打断也成为衡量大模型智能化的重要指标。声网自研的 AI VAD 技术,适应人类对话的停顿、语气和对话节奏,支持 AI 对话过程中随时打断。
领先的音频处理让 AI 对话更“听得清”
在人与人音视频通话的过程中,经常会遭遇环境噪音,影响沟通效率。在Gen AI 场景中,环境噪音同样无法避免。声网的解决方案具备业界领先的音频3A能力,即使在嘈杂的环境中,也能通过 AI 噪声抑制、背景人声过滤、音乐检测/过滤等算法,确保人与 AI 的对话不受环境干扰,始终保持顺畅,AI 也更听得清人说的话。
灵活可扩展的 AI Agent架构支持快速接入
AI Agent 作为大模型的应用框架,其重要性不言而喻。而开发者经常会根据自身的喜好或者业务场景选择不同的组件搭配 AI Agent。对此,声网的解决方案采用了灵活可扩展的 AI Agent架构,兼容市场主流的 ASR、LLM 和 TTS 技术,并具备工作流编排能力,帮助开发者与企业根据特定需求定制和扩展 AI 驱动的实时互动体验。
同时,这套方案支持 API 快速调用,提供开箱即用的场景化 Demo,最快 3h 即可实现方案快速验证,并提供端到端 SDK,同样适用于针对目标场景化业务开发,寻求整套技术方案的客户。
声网 Conversational AI Agents 架构图
目前,声网已与国内外多家 AI厂商展开了合作,借助 Conversational AI Agents 帮助客户实现了对话式AI 在智能助手、虚拟陪伴、口语陪练、语音客服、同声传译、智能硬件等多个场景的落地。例如虚拟陪伴场景,通过 AI 虚拟伴侣,在社交陪聊、亲情陪伴、游戏 NPC 等场景中提供 7x24h 时刻在线服务,可自定义人设、声音、形象等模拟真人声音及情感,为用户提供情感支持、心理慰藉以及陪伴。
口语陪练场景,通过拟人化的 AI口语老师,在外语考试、语法巩固、语言学习等场景提供更高性价比的外教陪练服务,借助定制化的分级语料训练,为不同流畅度的学员提供个性化的多语言发音指导。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

消息称 OPPO Find N5 折叠手机搭骁龙 8 至尊版，支持 IPX8 防水

微软 Surface Pro 12 商用版现身跑分库，搭酷睿 Ultra 7 266V

董明珠称格力芯片成功了：没有拿国家一分钱

全球首个端侧全模态理解开源AI模型发布，无问芯穹已累计融资近10亿

钱大妈&素礼坊豆制品标准生产示范基地正式揭牌

三星发布Galaxy Book 5 Pro系列笔电：搭载Lunar Lake，支持多项AI功能

Win11开始菜单“推荐”功能优化升级算法更新更准确

华为将重拾第1！中国销量前十机型：Mate 70击败苹果16 Pro Max

小米有数百项空调相关专利申请

索尼出品必大烂片？漫威电影《猎人克莱文》口碑票房双扑街

苹果史上最大iPhone就要来了！你敢信？

《巫师3》创造新纪录，十年经典老游戏成了爆款！

抱上贵州酱酒大腿，李亚鹏直播卖白酒，“拎壶冲”单瓶最高1298元

华为鸿蒙 HarmonyOS NEXT 系统“接续”功能玩法公布

苹果开发折叠屏iPad：18.8英寸巨屏无折痕史无前例

不计成本打造！荣耀GT今天发布关键配置一览

智元开启通用机器人商用量产

无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni

华为 WATCH GT 4 系列手表获推鸿蒙 HarmonyOS NEXT 5.0.0.30

智己汽车换帅贾健旭接任董事长

王化：小米空调没有专利侵权行为，更没有因为专利侵权赔偿的情况

开发者更方便！谷歌Chrome控制台新增AI功能：可快速调试网页

Win11应用商店UI被痛批！微软高管发声维护：测试数月总体很好

OPPO Find N5曝光搭载高通骁龙8 Elite和舰式潜望长焦

专业的薇娅更有情感，重塑电商直播的信任桥梁

武汉大学人工智能学院成立，小米集团称期待合作

算力需求分层，产业淘汰赛进行中 | ToB产业观察

全站最新

消息称 OPPO Find N5 折叠手机搭骁龙 8 至尊版，支持 IPX8 防水

“营销大师”跳槽MG名爵，这回又要点石成金？

微软 Surface Pro 12 商用版现身跑分库，搭酷睿 Ultra 7 266V

董明珠称格力芯片成功了：没有拿国家一分钱

全球首个端侧全模态理解开源AI模型发布，无问芯穹已累计融资近10亿

钱大妈&素礼坊豆制品标准生产示范基地正式揭牌

信阳国信发展集团拟发行10亿元公司债，获上交所受理

三星发布Galaxy Book 5 Pro系列笔电：搭载Lunar Lake，支持多项AI功能

热门推荐

消息称 OPPO Find N5 折叠手机搭骁龙 8 至尊版，支持 IPX8 防水

微软 Surface Pro 12 商用版现身跑分库，搭酷睿 Ultra 7 266V

董明珠称格力芯片成功了：没有拿国家一分钱

全球首个端侧全模态理解开源AI模型发布，无问芯穹已累计融资近10亿

钱大妈&素礼坊豆制品标准生产示范基地正式揭牌

三星发布Galaxy Book 5 Pro系列笔电：搭载Lunar Lake，支持多项AI功能

Win11开始菜单“推荐”功能优化升级算法更新更准确

华为将重拾第1！中国销量前十机型：Mate 70击败苹果16 Pro Max

小米有数百项空调相关专利申请

索尼出品必大烂片？漫威电影《猎人克莱文》口碑票房双扑街

苹果史上最大iPhone就要来了！你敢信？

《巫师3》创造新纪录，十年经典老游戏成了爆款！

抱上贵州酱酒大腿，李亚鹏直播卖白酒，“拎壶冲”单瓶最高1298元

华为鸿蒙 HarmonyOS NEXT 系统“接续”功能玩法公布

苹果开发折叠屏iPad：18.8英寸巨屏无折痕史无前例