最近,字节跳动旗下的AI大模型豆包火了,二级市场,相关概念股省广集团、天龙集团等集体大涨。
此外,OpenAI直播持续放大招,视频版GPT-1”时刻来了,ChatGPT也长眼睛了,王炸不断!
豆包火了,国内第一
据AI产品榜(由AI产品榜、36kr、硅星人联名发布)数据显示,全球总榜(App)上,11月份,国内互联网巨头字节跳动旗下的AI产品豆包位列第二,仅次于ChatGPT。
数据
国内总榜(App)上,排名前三的分别是豆包、百度旗下的文小言以及初创公司Moonshot旗下的Kimi,月活跃用户数均超千万;“五百万月活俱乐部”的成员包括讯飞星火、天工AI、智谱清言以及星野。
数据
再看一下AI产品网站(web)榜。
全球总榜(web)及亮点如下:11月份,ChatGPT增速减弱仅增长3.6%,月访问量39.2亿;微软Copilot继续增长15.38%,达8133万月访问量;Perplexity继续增长13.88%,但减速了,达1.07亿月访问量。
数据
国内总榜(web)及亮点如下:360AI搜索11月国内总榜第一,达2.82亿月访问量,略有下降;讯飞星火国内总榜11月增速第二,增速29.86%,达271万月访问量;豆包增长非常稳,截止当前每月增速都是20%以上。
数据
总的来说,从APP角度看,豆包APP的MAU(月活)达5998万,妥妥国内第一,全球第二。
此外,据量子位数据显示,截至11月底,豆包APP在2024年累计用户已超过1.6亿,每日平均新增用户下载量稳定维持在80万,成为全球排名第二,国内排名第一的AIapp。11月份,豆包APP DAU(日活)接近900万,排名第一。
资料显示,豆包大模型来源于字节跳动2023年研发的“云雀”大模型,是国内首批通过算法备案的大模型之一,今年5月15日在火山引擎原动力大会上正式发布。
值得一提的是,目前基于豆包大模型,字节跳动已经构建了丰富的产品矩阵,包括多功能AI助手“豆包App”、AI应用开发平台“扣子”、做图和视频生成的即梦AI、AI生图软件星绘、AI故事创作猫箱等,同时涵盖商用和消费端的使用需求。
硬件方面,基于豆包AI大模型,字节跳动首款AI智能体耳机Ola Friend,支持随时问答、英语陪练、旅行导游、音乐控制,以及情绪加油站等多项AI功能,凭借单耳仅6.6克的重量成为同类产品中最轻的产品,用户体验感良好。
视频版GPT-1时刻来了
最近AI领域除了豆包比较火,众所周知,OpenAI12天12场直播,也一直在放大招。
12月5日,OpenAI宣布将在未来的12天进行12场直播,称将发布一些“大大小小的新东西”。目前12场直播已经办了7场,龙龙这里简单为大家做一个汇总:
第二天,比较亮眼的是强化微调API,支持用户使用少量样本就能训练自己的专家模型。
第三天,发布sora,支持创建1080p、20s的视频,新增故事板、融合等新功能。
第四天,发布canvas,Canvas全量开放,且支持直接运行Python代码。
第五天,宣布ChatGPT集成到苹果iOS、iPadOS和macOS系统,允许用户在操作系统中直接访问ChatGPT的功能( 但国内用不了
)。
第六天,正式面向广大付费用户推出ChatGPT实时视频对话。
第七天,ChatGPT发布新增功能“Projects”,它允许用户创建特定项目,上传相关文件,设置自定义指令,并将所有与该项目相关的对话集中在一个地方,可以将其理解为一种智能文件夹,它不仅能帮助你整理对话,还能为复杂任务提供上下文支持。
这里面,最值得拿出来说道一下的就是第三天正式开放的Sora,以及第六天正式面向广大付费用户推出的ChatGPT实时视频对话功能 。
具体来说,12月10日直播第三天,OpenAI正式向用户开放人工智能视频生成模型Sora,同时宣布推出Sora的新版本SoraTurbo,版本将作为独立产品提供给ChatGPT Plus和Pro用户,单月最多可分别生成50/500个视频。
Sora能生成任意长宽比的视频,分辨率从480p到1080p,时长从5秒到20秒,同时新增几项功能:Remix(重混)、Re-cut(重新剪辑)、Storyboard(故事板)、Loop(循环)、Blend(混合)以及Style presets(风格预设)。用户可以上传自己的素材进行扩展、混合或重新编排,或者完全通过文本生成新的视频内容。
OpenAI CEO Sam Altam表示“大家可以将Sora看作视频版的GPT-1”。
国内方面,自OpenAI今年2月份发布Sora后,国内其他模型厂商也逐步落地类似Sora的产品,截至2024年10月,国内已经陆续发布了爱诗科技PixVerse、生数科技Vidu、字节跳动即梦、快手可灵、智谱清影和MiniMax海螺AI视频生成等相对较成熟的产品。
近段时间,AI视频领域也大动作不断。
11月8日,智谱技术团队发布并开源最新版本的视频模型CogVideoX v1.5,升级后的清影在复杂提示词理解等方面的能力得到提升,能够生成10秒、4k、60帧超高清画质,同时支持任意比例图像生成视频,可一次性生成4个视频。
11月28日,腾讯宣布混元大模型12月3日正式上线视频生成能力,用户可以在腾讯元宝App中提交申请试用。
12月10日,字节跳动视频生成模型PixelDance已在豆包电脑版正式开启内测,部分用户已开通体验入口,用户每日可免费生成10个视频。
ChatGPT长眼睛了,王炸来袭
除Sora外,第六天推出的能够实时视频对话&实时视频功能,也是个王炸。
为啥这样说?因为这意味着,ChatGPT从此有“眼睛”了,没有眼睛,它就只是一个会帮你生成内容、或者进行语音聊天的工具;但有了眼睛,眼睛还很好,这就像一个“人”,而不单单是“工具”了!
OpenAI的研究员在直播中进行了相关演示,比如如何用ChatGPT这个功能实时指导你做咖啡。
首先启动高级语音模式,分享自己的视频,包括一个水壶和一个滴漏器,然后直接提问,如何做一杯手冲咖啡?
ChatGPT首先会指导你在滴漏器中放置滤纸,并用热水冲洗以消除纸味,同时预热滴漏器和杯子。接着,用户被告知添加咖啡粉到滤器中,通常是每六盎司水约两汤匙咖啡粉。再往后,用户被指导轻轻地将少量热水倒在咖啡粉上,让咖啡粉“绽放”约30秒。
有网友表示,自己已经脑补了无数的应用场景:
1、充当导游:你出去玩,看到这个不认识,看到那个想了解,摄像头打开一照,一问,答案来了,还搜索个啥。
2、辅导小孩做数学题:可能比老师还聪明,还24小时随时想用就用,家教也不用请了。
3、心情不好,打开摄像头,它能看到你可能心情不好,陪你聊天,舒缓你的情绪,想方设法逗你开心。
大家平时用豆包吗,平时有用ChatGPT吗?感觉怎么样?欢迎评论区讨论交流呀~
免责声明(上下滑动查看全部)
任何在本文出现的信息(包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资有风险,过往业绩不 预示未来表现。力求文章所载内容及观点客观公正,但不保证其准确性、完整性、及时性等。本文仅代表作者本人观点。