1月15日,科大讯飞正式发布了国内首个具备端到端语音同传能力的大模型——星火同传语音大模型。该模型适用于多种国际交流场景,包括日常对话、商务交流和行业翻译等,能够满足高难度的同传翻译需求。
新模型的优化显著提高了翻译字幕的呈现速度,确保了中英互译的准确性,从而为用户带来了更加流畅、精准的同传体验。此外,该模型还支持译文长度反向调控,能够进行语音到文本的端到端翻译,支持流式意群切分、语境理解、信息重组。同时,流式语音合成技术支持意群韵律衔接和自适应语速调节。
在内容完整度、信息准确度以及语言质量方面,星火语音同传大模型均达到了行业领先水平。它甚至超越了谷歌的Gemini 2.0和OpenAI的GPT-4o,实现了最快5秒内的同传时延,接近人类专家译员的表现。