近日,实验室杨瑞博士以第一作者在《Expert Systems With Applications》期刊上发表题目为“Semantic Layout-Guided Diffusion Model for High-Fidelity Image Synthesis in "The Thousand Li of Rivers and Mountains"”的研究成果。论文通讯作者吴晓军教授。

该论文以中国传统山水画经典画作《千里江山图》为例,提出了一种全新的基于扩散模型的图像生成框架。该框架通过语义布局指导,生成具有不同语义属性的山水画图像,并引入布局增强映射与潜在布局注入策略,有效提升了语义保真度和颜色分布的质量。为解决大尺寸图像训练的技术难题,团队开发了专门的数据增强方法。研究成果为艺术教育、数字文化遗产的创新再创作提供了新的技术解决方案。
论文链接:https://doi.org/10.1016/j.eswa.2024.125645