可组合扩散模型发布:可生成任意模态的内容
(资料图)
近日,微软发布了一款名为可组合扩散模型(CoDi)的人工智能模型。这是一种独特的、基于可组合扩散的人工智能模型,其设计目标是互动和生成多模态内容。 微软设计CoDi的目标,是为了解决传统单一模态AI模型的局限性。例如,在同步视频和音频的情况下,独立生成的信息流拼接在一起时可能存在不一致和对齐的问题。CoDi采用了独特的可组合生成策略,在扩散过程中对齐多模态,从而生成相互交织的模式。更重要的是,CoDi能够处理任意输入模式并生成任意模态的内容。 CoDi是由微软Azure认知服务研究团队与北卡罗来纳大学教堂山分校合作开发的,也是微软项目i-Code的一部分,该项目使用人工智能来增强人机交互。对此项目感兴趣的用户可以深入了解。
标签: