AI速递 20240914

IP属地北京 编辑：杨凌霄腾讯研究院 时间：2024-09-17 21:32:14

生成式AI
一、 OpenAI震撼发布o1大模型！「强化学习」突破LLM推理
1. OpenAI发布o1模型，具备强化学习和复杂推理能力，能处理比以往模型更难的科学、代码和数学问题;
2. o1模型通过强化学习训练，优化思维链，提高解决问题的能力，表现在多个基准测试上超越人类专家;
3. o1-mini版本提供成本效率更高的选择，尤其在编程和STEM推理任务上表现出色，但在非STEM任务上表现较差。
二、国产最大MoE开源模型发布！腾讯AI Lab创始人姚星带队
1. 元象XVERSE发布国内最大MoE开源模型XVERSE-MoE-A36B，拥有2550亿参数，提供无条件免费商用;
2. 该MoE开源模型相比Dense模型训练时间减少30%，推理性能提升100%，通过优化拓扑设计和数据动态切换提高效率;
3. 元象持续开源高性能模型，包括超长上下文窗口大模型，推动AI应用进入长文本时代，同时开发AI互动网文App Saylo。
三、 8B模型多页文档理解新SOTA，324个视觉token表示一页
1. 阿里mPLUG-DocOwl 2模型使用324个视觉token表示一页文档图片，减少80%视觉token使用，提高文档理解效率;
2. 模型支持高达60页文档的一次性输入，采用三阶段训练框架优化单页和多页文档问答性能;
3. DocOwl 2通过高分辨率压缩和语言模型多模态理解，实现多页文档理解新SOTA，有效减少计算资源浪费。
四、一帧图像，一段音频生成视频，字节和浙大联合项目Loopy
1. Loopy利用单帧图像和音频生成自然视频，通过端到端音频驱动视频生成模型实现;
2. 结合ReferenceNet和DenoisingNet，通过空间注意力层和token维度拼接，保持生成视频的视觉一致性和细节;
3. 音频模块使用Wav2Vec提取特征，通过交叉注意力机制结合音视觉特征，增强音频与视频的协同表达。
五、智谱携清言视频通话功能亮相 2024 服贸会，开启 AI 新体验
1. 智谱推出清言App视频通话功能，实现跨文本、音频和视频的实时推理交互;
2. 清言视频通话支持多种实用场景，如即时翻译、教育辅导、环境解释，提升用户体验;
3. 智谱同时展示其他AI产品如CogVideoX视频生成模型和多模态大模型，展现技术进展和应用广度。
六、太能写了！体验完夸克CueMe智能助手，小编直呼被解放
1. 夸克CueMe智能助手支持多体裁写作，能生成高质量内容，包括长达2万字的超长文本;
2. 体验者强调CueMe的五大优点：体裁丰富、内容准确、文本流畅、字数可控、超长文本能力;
3. CueMe基于夸克大模型开发，优化了长文本理解、专业知识检索、多轮文创指令遵循，提高写作质量和效率。
前沿科技
七、 SpaceX再创历史，人类首次商业太空行走成影像资料发布！
1. SpaceX实现人类首次商业太空行走，由亿万富翁贾里德·艾萨克曼领衔，成功在距地球700公里外进行舱外活动;
2. 艾萨克曼使用“天行者”梯子和3.7米长的系绳在太空中进行移动，整个活动持续超过20分钟，测试了SpaceX宇航服性能;
3. 任务包括1400公里高空实验，如激光测试和辐射数据收集，展示SpaceX技术的安全性和可行性，推动商业太空旅行发展。
报告观点
八、 OpenAI o1比博士还“聪明”，听听全球11位AI大咖怎么说？
正面：
1. OpenAI o1模型被认为是推动AI进入复杂推理时代的关键，具备前所未有的推理能力;
2. 该模型通过强化学习优化，能在给出答案前进行深入思考，提高了问题解决的准确性和深度;
3. 支持者认为o1模型开启了新的技术范式，尤其在处理复杂的科学和数学问题上表现出色，超越了传统模型。
反面
1. 批评者认为o1模型的能力和实用性尚未经过充分测试，其在实际应用中的表现仍不明确;
2. 模型被视为距离真正的通用人工智能（AGI）还有较远的距离，尚未能全面超越人类的智能水平;
3. 存在过度宣传的问题，部分专家指出模型的局限性和在某些领域内的表现不如旧模型。
九、麻省理工科技评论：游戏产业变革，下款爆款或由AI打造
1. AI工具如Midjourney和Roblox工具正在被用于加速游戏开发，通过生成式AI创建游戏环境和场景，减少开发时间和劳动强度;
2. Roblox的新工具允许开发者通过文本提示快速生成复杂的3D环境，提高创作效率和实现个性化设计的可能性;
3. 尽管AI在游戏开发中提供了效率优势，但也引发了对创意工作自动化和潜在失业问题的担忧，特别是对3D艺术家和编剧的影响。
十、对话英伟达高级产品经理：AI推理相比6年前已提速3000倍
1. AI推理速度在过去六年中提升了3000倍，主要得益于硬件进步和量化技术的改进；
2. 合成数据的使用在模型训练中变得关键，有效减少了对真实数据的依赖，提高了训练效率；
3. 提高计算效率使AI能更自然地融入游戏和影视等内容产业，改善用户体验，后续或将在NPC行为模拟中展现出新的可能性。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

张小北谈AI：电影人要尽快找到和 AI 技术共生的方式

AI巨头重磅发声！

“AI教母”李飞飞最新访谈：空间智能是下一个“北极星”，将改变AI发展进程

周靖人：全面投入升级AI大基建

AI+医疗，到底有什么用？

看到人类这么懒，AI都笑了

QuestMobile2024 AI智能体应用洞察半年报：AI类APP月活超6600万

AI时代的三大问题

AI生成内容以假乱真如何甄别？网信办新规公开征求意见，专家：防范AI造假风险

智能体时代，AI正从“神坛”走向“人间”

给自己一个微笑 | AI晚读

京东健康携手武大人民医院共建AI辅助病历生成系统

苹果在AI竞赛中落后于华为吗？

AI软件必须用GPU么？

疯狂对标OpenAI，智谱AI要背水一战

社区学校里还能学AI？

AI时代，长剧集出海跨向“新一程”

OpenAI重金押注，机器人NEO世界模型登场！机器人迎来ChatGPT时刻？

把 AI 融入日常的 5 个 Prompt 制作思路

【AI与金融行业】认知思考与应用

中断与中国合作后，阿联酋AI公司G42获得英伟达AI芯片采购许可

AI热成像助力AEB性能提升

EA首席执行官表示AI现在是“我们业务的核心”

荣耀CEO赵明：AI正重塑智能终端

《因Ai相约》：一档有售后的AI交友节目

AI，让团圆更简单——爱采购「解救月亮行动」温情上线

苹果的“AI茅”之路只走了一半

全站最新

自主品牌业绩集体向上比亚迪引领汽车“技术平权”时代到来

台州国际车展吉利包馆参展展示智能新能源转型成果

全新岚图梦想家上市售价32.99万-44.99万元

全新岚图梦想家上市！PHEV售42.99万起 EV售44.99万起

四十里城子镇团委开展“牵手团缘·青春偕进”青年交友联谊活动

浙江“95后”女博士六年磨一“轴” 材料利用率提升至95%

何小鹏驾驶“全球首款AI汽车”亮相

广汽集团与华为签署数字化战略合作备忘录

热门推荐

【西街观察】AI还没甩掉手机依赖症

张小北谈AI：电影人要尽快找到和 AI 技术共生的方式

AI巨头重磅发声！

瑞银：AI成股市回报关键驱动力

“AI教母”李飞飞最新访谈：空间智能是下一个“北极星”，将改变AI发展进程

华为徐直军谈AI算力热潮:企业并非必须建设大规模AI算力

周靖人：全面投入升级AI大基建

AI+医疗，到底有什么用？

在南大，人人都能学AI

AI“缝”搜索

看到人类这么懒，AI都笑了

QuestMobile2024 AI智能体应用洞察半年报：AI类APP月活超6600万

AI时代的三大问题

AI生成内容以假乱真如何甄别？网信办新规公开征求意见，专家：防范AI造假风险

智能体时代，AI正从“神坛”走向“人间”

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

AI速递 20240914