【头部财经】7月11日消息,近日,微软发布了一篇新闻稿,宣布推出了一种名为可组合扩散模型(CoDi)的人工智能模型,该模型的设计目标是互动和生成多模态内容。
CoDi 是一种独特的、基于可组合扩散的模型,旨在解决传统单一模态 AI 模型的局限性。在同步视频和音频等情况下,独立生成的信息流拼接在一起时可能会出现不一致和对齐的问题。而 CoDi 采用了一种独特的可组合生成策略,在扩散过程中对齐多模态,从而生成相互交织的模式。
更重要的是,CoDi 能够处理任意输入模式并生成任意模态的内容。这种能力使得 CoDi 在生成多模态内容时具有更高的灵活性和可扩展性。
CoDi 由 Microsoft Azure 认知服务研究团队与北卡罗来纳大学教堂山分校合作开发,也是 Microsoft 项目 i-Code 的一部分。该项目旨在使用人工智能来增强人机交互,并将 CoDi 作为其中的一项关键技术。
微软表示,通过 CoDi 的研究和应用,他们希望进一步推动人工智能领域的发展,并为用户提供更加智能、高效、灵活和多样化的交互体验。