当前位置: 首页 » 资讯 » 新科技 » 正文

五分钟生成一档播客?AI播客会是AIGC的下一个赛点吗?

IP属地 北京 编辑:钟景轩 雷科技 时间:2025-03-26 17:33:13

不得不说,生成式AI真的改变了很多东西。

作为一个没啥艺术细胞的文科生,在生成式AI大模型出来前,我所能做到的“内容产出”,也就是挥动手指,敲击键盘,让数字信号夹杂着中文字符出现在电脑屏幕上,仅此而已。

但现在,哪怕本身对绘画一窍不通、对乐理更是毫无理解,只要懂得提示词的编写,我就能够轻松“制作”不同风格的画作、“产出”各种流派的音乐,就连播客这种号称“小而美”的传播媒介,似乎也没有那么神秘了。

3月25日,网易有道宣布有道文档FM开启公测。

(图源:有道)

作为一款有声阅读、学习效率工具,有道文档FM号称支持拍照、文档、链接、长文本等多形式内容一键转播客,还能迅速提炼核心要点,生成简洁明了的总结与思维导图,让你一眼洞悉内容主旨。

我决定帮大伙试一下,是时候看看国产AI播客到底能不能打了。

「懒狗」也能做播客

想要体验有道文档FM,其实还蛮简单的。

打开自己手机上的应用商店,搜索“有道文档FM”,看到那个像蓝色气泡的图标点击下载就行。

反正现在是公测阶段,又不需要邀请码啥的,我的评价是有手都会。

(图源:)

打开应用,你会看到一些官方制作的播客示例。

我先是试着听了一下随应用附带的“《日航的奇迹》:飞向天际的涅槃”,基本上就是通过生成式AI对原作进行了比较简明扼要的剖析解读,AI主持人能够做到抑扬顿挫、自然停顿和模拟真人的吸气呼气声,听起来并没有明显的违和感。

当然了,这只是官方给出的例子,实际效果还得我们自己测试。

有道文档FM为用户提供了四种新建播客的方式,你可以拍照片、扔网址、扔文件,也可以只粘贴文字,需要注意的是,免费用户上传的文件不能超过5MB,需要开启会员之后才能扩展到20MB。

(图源:)

在导入文本后,有道文档FM会提供包含文本朗读在内的二十种播客类型供用户选择,不同的类型会对转写后的播客脚本带来一定差异,然后可以选择你喜欢的音色,它提供了13种男性声线、11种女性声线,包括新闻男声、电台主播、深夜电台、元气青梅等。

(图源:)

为了测试转播客的效果,我特地准备了三段不同的文本。

为啥是三段,主要是因为免费体验次数只有三次。

第一段文本,是我早年间混迹SteamCN(今keylol)论坛所写的文章,《CRPG简述》,约莫着5000字左右的文本,刚好可以看一下这种亚文化内容转写的效果如何。

接下来,只要点一下生成,实测5000字的文本大约耗时2-3分钟,你就能得到一个大约六分钟的,由两个AI主持人进行“深度探讨”的中文音频播客。

内容如下,感兴趣的读者可以自己下载听一下:

(图源:)

从内容上来说,有道文档FM很会抓重点,基本能把稿件中的重要内容摘出来。

以这段播客为例,从主播A迷恋上《神界:原罪2》这款游戏作为引入,两位AI主播围绕着CRPG游戏类型的定义、CRPG游戏的起源以及发展过程,讲得那叫一个头头是道。

(图源:)

它还可以将稿件打碎,并用口语化语言,在两人一唱一和中表达出来。

第二段文本,是我去年参加的一次群访,采访的对象是机械革命创始人潘春节。

嗯...这次转化出来的播客脚本就显得有些死板了,不知道是不是因为对专访类内容资料不足的缘故,最终转化出来的播客脚本,基本就是两位AI主播在添加了一些语气词的情况下对原文进行复述。

(图源:)

幸好,除了这段播客外,为了方便阅读,有道文档FM还在页面上方给出了文字版,甚至还提供了AI总结和思维导图,让用户能够更有条理地抓住文本的知识点,怎么都是有用的。

第三段文本,是我在大学时撰写的一本三流小说,第一部分约7.5万字,正好可以测试一下有道文档FM的“小说剧场”选项。

诶,这次转写时间就长了不少,等了十几分钟后,有道文档FM总算是端出了一份长达35分钟的播客内容。

从转写的效果来看,有道文档FM确实能够识别角色的行动,并将背景、对话、行动以较合理的方式拆解并讲述下去,就是不清楚现在有什么BUG,导致这段播客中频繁出现“让我们继续这个引人入胜的故事”这句话。

(图源:)

每当AI主播读到这句话,就会让人有种从内容中被抽离出来的感觉。

除此以外,目前有道的AI播客还有一些瑕疵。

比如有些男性声音,存在语速较慢,还无法控制语速的问题。

尤其是新闻男声和电台主播,男生磁性音色,再加上字正腔圆的咬字,或许会适合解说纪录片,但在播客中就过于突兀,相声评书的音色里甚至含有一些杂音,让人很是出戏。

但就目前来说,有道文档FM在内容上确实没有毛病,听感也算正常,最终产出的内容可能更接近于老师上课时的知识解读。

当然了,有道自己可以也是这样定位的。你可以对自己手头有的资料进行学习,也可以直接用公众号链接转播客,快速吸收今日要闻和知识,借助这玩意自带的DeepSeek,你甚至可以实现提出问题,DeepSeek给出回答,然后就能直接转写成播客内容吸收的体验。

比起放空大脑的享受,它的最大价值,或许还是丰富了学习的场景吧。

AI播客起风了?

事实上,AI播客的诞生距离我们并不遥远。

2024年9月,谷歌的NotebookLM推出了名为“Audio Overview”的功能,该功能可以将用户上传的内容转换为音频对话,由两位AI主播进行讨论,其内容流畅,音质逼真,仿佛真的有两个人在对谈。

(图源:NotebookLM)

作为整个类型的开创者,NotebookLM可能是这类产品里最有“创造力”的,因为它生成的脚本并不会拘泥于用户提供的内容,而是会在此之上进行相关内容的扩展,还能根据需要调整语速,男女主播吐字清晰,语音语调自然真实,在音频播放期间用户甚至可直接与AI主持人互动等功能。

对我们来说,这款产品最大的缺陷,估计是它只支持英文内容的生成这点吧。

不管咋说,这款产品的出现,让人们看到了AI播客的潜力。人们不但可以用它快速消化大量信息,把长篇大论变成有趣的对话,在做家务或者开车的时候"阅读"那些平时没时间看的文章,甚至可以用来准备演讲稿,听听别人(特别是AI)怎么看待你的观点。

受此影响,在AI技术的推动下,播客制作和分发变得更加便捷,涌现出了如“Listen Notes”、“Podcastle”、“De”等热门应用。这些平台利用AI语音转写、智能剪辑和音频增强等功能,大大降低了播客制作的门槛,使得更多人可以轻松地创建和分享自己的播客节目。

毋庸置疑的是,播客,将成为下一个AI涌入的赛道。

放在国外,这很顺理成章,因为播客在欧美算是个颇具市场号召力的领域,月度收听人数一度超过他们总人口的三分之一。

但在国内,一切大不相同,因为对中文互联网而言,播客一直都是种小众又有些神秘的存在,喜欢的人死心塌地,不懂的人隔着墙壁。

(图源:抖音)

移动互联网的普及,让广罗大众早就习惯了视频和短视频的内容消费体系,上下滑动的手指和高速刷新的视频流,更是让超高速信息获取成为了一种习以为常的事情,也使得播客这种相对“慢”的音频形式与快节奏的互联网显得格格不入。

当然了,并非每个人都会沉迷于视觉带来的感官刺激,凭借其独特的陪伴感和深度,播客还是成功吸引了一批忠实听众和创作者。当你在早晚高峰的地铁上,看到有人戴着耳机“闭目养神”,却又时而露出神秘的笑容,那他很有可能是在听播客。

而我,恰好也算是个播客的“消费者”。

在我看来,播客并不是什么“更为纯粹和深刻的交流方式”,而是更接近于一种充分利用碎片化时间的媒介,它排除了视觉干扰,让你在通勤、运动、打扫卫生的时候,都能找到机会沉浸在对话和叙事之中,抓住一切时间汲取感兴趣的观点。

对效率至上主义者来说,这点真的挺难能可贵的。

只可惜,国内播客节目发展的情况,可远没有播客爱好者们想象的那么轻松,在亚文化播客圈里颇具影响力的“机核”,甚至在近一年时间里接连撤裁了多位核心主播,变现与热爱之间的冲突似乎正在愈演愈烈。

有道文档FM的存在,在一定程度上算是填上了“中文AI播客”这个市场的空白,它从学习的交互形式出发,将文档内容直接生成AI播客,给用户提供了一种对特定知识进行大量有效输入的方法,是一款非常适合学习的AI应用。

曾经小众的播客,会因为被教育场景盯上而不再小众吗?

或许只有时间能给我们答案。

3月20日-3月23日,AWE(中国家电及消费电子博览会) 2025 盛大开幕,海信、TCL、长虹、雷鸟、添可、追觅、云鲸、小熊、萤石、韶音、海尔、三翼鸟、九阳、科沃斯、万和、索尼、三星、LG等巨头重磅参展,DeepSeek掀起的AI工业化浪潮如何影响家电成重要看点,“AI家电”风起云涌,AWE 2025报道团正在全程追踪报道,敬请关注。

AWE25 系列专题

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新