近日,腾讯正式推出并开源了其全新的原生多模态图像生成模型 ——“混元图像3.0(HunyuanImage3.0)”。这一新模型的参数规模达到惊人的80B,标志着在图像生成领域的一次重大技术突破。值得一提的是,混元图像3.0不仅是首个开源的工业级多模态生图模型,其表现也与行业内顶尖的闭源模型相媲美。
该模型的能力十分强大,它能够利用丰富的知识进行推理,解析复杂的千字级语义,并生成长篇文本。这对于需要创作高质量内容的设计师和开发者来说,无疑是个福音。腾讯表示,混元图像3.0的推出将进一步推动人工智能生成内容(AIGC)技术的发展。
回顾混元系列的发展历程,混元图像3.0是继今年5月发布的2.0版本后的又一重要升级。值得注意的是,2.0版本已经实现了毫秒级的响应速度和超写实的图像质量,用户在输入文本时可以实时看到生成的图像。而3.0版本则在此基础上,进一步增强了模型的复杂性与表现力。
除了图像生成,腾讯混元系列还先后推出了3D 生成模型(2.0和2.5版本)、定制化图像生成插件 InstantCharacter,以及多模态视频生成工具 HunyuanCustom,形成了一套完整的 AIGC 技术矩阵。这些工具的推出,不仅提升了创作者的工作效率,也为整个行业带来了更多的创新可能。
腾讯的这一新模型的开源,意味着更多开发者和研究者能够利用这一强大的工具,推动多模态生成技术的进一步研究与应用。无疑,这将加速人工智能与各行各业的深度融合,为未来的创作带来无限可能。
文章来源:https://news.aibase.cn/news/21622