USO“，一种基于分离和奖励学习的新方法：走在将风格和主题融为一体的图像生成的最前沿-编程阁

概述

近年来，"风格驱动生成 "和 "主题驱动生成 "作为图像生成中的两个独立问题被研究。
前者强调参考图像的风格，而后者侧重于保持人物或物体的一致性，两者被视为对立的。

然而，本文认为可以将两者视为统一的。
原因在于，这两项任务无非都是将 "内容 "和 "风格 "进行分离和重新组合的任务。

因此，作者提出了 USO（统一风格-主体优化）模型。
USO 建立了一个大型三元组数据集（内容图像、风格图像和风格应用图像），并进一步将风格对齐学习和内容-风格分离学习结合起来风格对齐学习和内容-风格分离学习。

此外，还引入了风格奖励学习（SRL），以增强风格保真度。
作者还建立了一个新的基准–USO-Bench，以同时评估风格相似性和主题一致性。

实验结果表明，USO 优于传统方法，在风格和主题一致性方面都达到了最先进的水平。

建议的方法

USO 的核心思想是将风格驱动任务和主题驱动任务作为 "互补任务 "同时学习。

首先，作者构建了一个跨任务三元组保存框架（Cross-Task Triplet Curation Framework）。
这是一种使用风格化专用模型和去风格化模型自动生成三重数据（参考风格图像、主题参考图像和风格应用结果图像）的机制。

接下来是统一定制框架统一定制框架（USO）。
学习分为两个阶段。

在第一阶段，使用 SigLIP 编码器和分层投影仪进行风格对齐训练，确保能够准确提取风格特征。
在第二阶段，内容和风格图像被输入到不同的编码器中，以执行内容-风格分离训练（Content-Style Disentanglement Training），避免不必要的特征污染。

此外，还引入了风格奖励学习（SRL），将生成的结果与参考风格的接近程度作为奖励信号反映在训练中。
这成功地同时提高了风格保真度和主体一致性。

实验

为了测试所提方法的有效性，作者使用新构建的 USO-Bench 和现有的 DreamBench 进行了大规模实验。

USO-Bench 是一个结合了 50 种不同内容图像和 50 种不同风格图像的基准，可以全面评估主题驱动、风格驱动和两者结合的任务。
评估指标包括衡量主题一致性的 CLIP-I 和 DINO、衡量风格相似性的 CSD 以及衡量文本和图像一致性的 CLIP-T。

实验结果表明，USO 在主题驱动和风格驱动任务中的表现均优于现有方法，尤其是在同时处理风格和主题的复杂任务中，表现出了显著的性能提升。
在定量评估中，CSD 和 CLIP-T 的得分最高；在定性评估中，USO 忠实地再现了各种绘画风格，同时保留了主体的外观。

此外，消融实验证实，风格奖励学习和分层投影对性能的提高有很大帮助。
总之，可以得出结论，USO 是一种最先进的统一生成模型，可以同时实现风格和主题。

League Akari智能助手：英雄联盟玩家的全能游戏伴侣

在英雄联盟的激烈对局中，每一秒都至关重要。League Akari作为一款功能全面的智能辅助工具，专门为LOL玩家设计，通过自动化技术让您专注于真正的游戏乐趣，告别繁琐操作。【免费下载链接】LeagueAkari ✨兴趣使然的，功能…

李华

百度网盘下载提速实战：从蜗牛爬行到高速飞驰的完整指南

你是否经历过这样的场景？面对百度网盘中几个G的重要文件，下载进度条却像蜗牛般缓慢爬行，焦急等待中时间一分分流逝...别担心，今天我们就来解决这个数字时代的效率痛点。【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件…

李华

测试文档的死亡与重生：何时需要，如何撰写？

一个老生常谈的争议在敏捷与DevOps的声浪中，“测试文档无用论”一度甚嚣尘上。它们被视为瀑布时代的遗物，是拖慢流程、制造信息孤岛的元凶。然而，在真实的软件研发战场上，缺失或劣质的测试文档所引发的沟通成本、知识断层与质量…

李华

建立测试知识库：避免“知识孤岛”与“重复造轮子”

在快速迭代的软件开发周期中，测试团队常面临两大挑战：一是测试知识分散于个体之间，形成互不联通的“知识孤岛”；二是不同项目或团队为解决相似问题反复投入精力，造成“重复造轮子”的资源浪费。一个集中、有序、可共享…

李华

NVIDIA显卡性能优化终极指南：Profile Inspector深度使用教程

NVIDIA显卡性能优化终极指南：Profile Inspector深度使用教程【免费下载链接】nvidiaProfileInspector 项目地址: https://gitcode.com/gh_mirrors/nv/nvidiaProfileInspector 想要完全释放NVIDIA显卡的隐藏性能吗？NVIDIA Profile Inspector正是…

李华

运维系列数据库系列【仅供参考】：达梦数据库：系统存储过程和函数DM8 SQL

达梦数据库：系统存储过程和函数DM8 SQL 系统存储过程和函数DM8 SQL 系统存储过程和函数DM8 SQL 1) INI 参数管理 SF_GET_PARA_VALUE 定义： int SF_GET_PARA_VALUE ( scope int, ini_param_name varchar(256) ) 功能说明：返回 dm.ini 文件中非浮点和字符串类型的参数值参数…

李华