当前位置: 首页 » 资讯 » 智能车 » 正文

实测升级后的文小言:吉卜力风周边一键生成,全新语音大模型、图片问答齐亮相

IP属地 北京 编辑:柳晴雪 搜狐科技 时间:2025-03-31 21:00:33

出品 |

作者 | 任婧瑄

编辑 | 杨锦

3月31日,在百度AI DAY上,文小言宣布完成品牌焕新与功能升级。全新的文小言不仅搬出了刚上线不久的自研文心大模型X1和4.5,接入了满血版DeepSeek-R1、可灵等第三方模型进行多模型融合调度,还升级了全新语音大模型、图片问答、AI生图生视频等一系列新玩法。

现在,用户可以选用新推出的“自动模式”一键调用最优模型组合,无需在不同任务间反复切换。当然,用户也可以继续选择单一的DeepSeek或文心大模型来完成特定任务。

百度AI产品创新业务负责人薛苏

对于此次全面升级,百度AI产品创新业务负责人薛苏强调:“AI的未来不再是单纯的技术参数比拼,而是如何通过多模型协同,真正为用户创造价值。文小言希望通过开放生态,整合顶尖模型能力,做出更强大、更简单的AI产品。”

实测显示,若切换至文心大模型并指定文心X1来解决问题,其优势在于灵活调用工具。以“设计吉卜力风的帆布包”为例,文心X1首先能精准解析吉卜力风格特点,再多次连续调用AI绘图工具,一口气生成帆布包的正反面效果图。

拍摄一张非全景的布鲁克林大桥,文小言也可以调用文心4.5的多模态分析能力,精准识别出照片的地理位置、背景建筑、城市特点等详细信息。

还可以在拍摄的过程中直接用语音问问题,说完话文小言会自动拍摄并识别语音进行作答。

在传统图片问答的基础上,文小言还能基于原图设计一键二创。只需上传一张水杯的照片,它就能调用图片理解和AI绘图等工具,设计出同款抱枕和鼠标垫。但实测时也发现,当原图元素过于复杂时,仍会出现文字拼写有误、主体不一致的问题。

百度还把拍照搜题功能也整合进文小言了,在拍照界面选择“解题老师”,文小言就会自动调出百度教育常年积累的资源,而且很多题目都有视频版数字人讲解。

此外,文小言还有百度全新的语音大模型加持,不仅支持重庆、广西、河南、广东、山东等特色方言对话,还能随意切换蜡笔小新、孙悟空、熊大熊二等百变音色,既能处理复杂知识问答,也可以在角色扮演时随时打断。

实测后能明显感受到对话整体延迟度的降低。百度语音首席架构师贾磊透露,该模型是百度在业界首个推出、基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,其调用成本比行业平均降低50%-90%,推理响应速度极快,可将用户等待时长从行业常见的3-5秒降低至1秒左右。

虽然暂不支持图生图功能,但文小言已经融合了文生图、AI修图、AI视频生成、科普解读向新功能“图个冷知识”等诸多新玩法。

谈及文小言的商业模式,百度AI产品创新业务负责人薛苏表示:“过早进行商业模式的探索,或者在一个不稳定的用户基础上做商业化探索,可能对产品是会有一些损失的。所以目前我们会全面的拥抱免费,然后全面的关注用户体验的打磨,这是我们第一优先级。”

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新