当前位置: 首页 » 资讯 » 人工智能 » 正文

AI速递 20240914

IP属地 北京 编辑:杨凌霄 腾讯研究院 时间:2024-09-17 21:32:14

生成式AI

一、 OpenAI震撼发布o1大模型!「强化学习」突破LLM推理

1. OpenAI发布o1模型,具备强化学习和复杂推理能力,能处理比以往模型更难的科学、代码和数学问题;

2. o1模型通过强化学习训练,优化思维链,提高解决问题的能力,表现在多个基准测试上超越人类专家;

3. o1-mini版本提供成本效率更高的选择,尤其在编程和STEM推理任务上表现出色,但在非STEM任务上表现较差。

二、 国产最大MoE开源模型发布!腾讯AI Lab创始人姚星带队

1. 元象XVERSE发布国内最大MoE开源模型XVERSE-MoE-A36B,拥有2550亿参数,提供无条件免费商用;

2. 该MoE开源模型相比Dense模型训练时间减少30%,推理性能提升100%,通过优化拓扑设计和数据动态切换提高效率;

3. 元象持续开源高性能模型,包括超长上下文窗口大模型,推动AI应用进入长文本时代,同时开发AI互动网文App Saylo。

三、 8B模型多页文档理解新SOTA,324个视觉token表示一页

1. 阿里mPLUG-DocOwl 2模型使用324个视觉token表示一页文档图片,减少80%视觉token使用,提高文档理解效率;

2. 模型支持高达60页文档的一次性输入,采用三阶段训练框架优化单页和多页文档问答性能;

3. DocOwl 2通过高分辨率压缩和语言模型多模态理解,实现多页文档理解新SOTA,有效减少计算资源浪费。

四、 一帧图像,一段音频生成视频,字节和浙大联合项目Loopy

1. Loopy利用单帧图像和音频生成自然视频,通过端到端音频驱动视频生成模型实现;

2. 结合ReferenceNet和DenoisingNet,通过空间注意力层和token维度拼接,保持生成视频的视觉一致性和细节;

3. 音频模块使用Wav2Vec提取特征,通过交叉注意力机制结合音视觉特征,增强音频与视频的协同表达。

五、 智谱携清言视频通话功能亮相 2024 服贸会,开启 AI 新体验

1. 智谱推出清言App视频通话功能,实现跨文本、音频和视频的实时推理交互;

2. 清言视频通话支持多种实用场景,如即时翻译、教育辅导、环境解释,提升用户体验;

3. 智谱同时展示其他AI产品如CogVideoX视频生成模型和多模态大模型,展现技术进展和应用广度。

六、 太能写了!体验完夸克CueMe智能助手,小编直呼被解放

1. 夸克CueMe智能助手支持多体裁写作,能生成高质量内容,包括长达2万字的超长文本;

2. 体验者强调CueMe的五大优点:体裁丰富、内容准确、文本流畅、字数可控、超长文本能力;

3. CueMe基于夸克大模型开发,优化了长文本理解、专业知识检索、多轮文创指令遵循,提高写作质量和效率。

前沿科技

七、 SpaceX再创历史,人类首次商业太空行走成影像资料发布!

1. SpaceX实现人类首次商业太空行走,由亿万富翁贾里德·艾萨克曼领衔,成功在距地球700公里外进行舱外活动;

2. 艾萨克曼使用“天行者”梯子和3.7米长的系绳在太空中进行移动,整个活动持续超过20分钟,测试了SpaceX宇航服性能;

3. 任务包括1400公里高空实验,如激光测试和辐射数据收集,展示SpaceX技术的安全性和可行性,推动商业太空旅行发展。

报告观点

八、 OpenAI o1比博士还“聪明”,听听全球11位AI大咖怎么说?

正面:

1. OpenAI o1模型被认为是推动AI进入复杂推理时代的关键,具备前所未有的推理能力;

2. 该模型通过强化学习优化,能在给出答案前进行深入思考,提高了问题解决的准确性和深度;

3. 支持者认为o1模型开启了新的技术范式,尤其在处理复杂的科学和数学问题上表现出色,超越了传统模型。

反面

1. 批评者认为o1模型的能力和实用性尚未经过充分测试,其在实际应用中的表现仍不明确;

2. 模型被视为距离真正的通用人工智能(AGI)还有较远的距离,尚未能全面超越人类的智能水平;

3. 存在过度宣传的问题,部分专家指出模型的局限性和在某些领域内的表现不如旧模型。

九、 麻省理工科技评论:游戏产业变革,下款爆款或由AI打造

1. AI工具如Midjourney和Roblox工具正在被用于加速游戏开发,通过生成式AI创建游戏环境和场景,减少开发时间和劳动强度;

2. Roblox的新工具允许开发者通过文本提示快速生成复杂的3D环境,提高创作效率和实现个性化设计的可能性;

3. 尽管AI在游戏开发中提供了效率优势,但也引发了对创意工作自动化和潜在失业问题的担忧,特别是对3D艺术家和编剧的影响。

十、 对话英伟达高级产品经理:AI推理相比6年前已提速3000倍

1. AI推理速度在过去六年中提升了3000倍,主要得益于硬件进步和量化技术的改进;

2. 合成数据的使用在模型训练中变得关键,有效减少了对真实数据的依赖,提高了训练效率;

3. 提高计算效率使AI能更自然地融入游戏和影视等内容产业,改善用户体验,后续或将在NPC行为模拟中展现出新的可能性。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。