扩散模型内生水印 (In-Generation Watermarking)
Noise-as-Watermark (NaW) 范式:将水印嵌入 DDIM 初始潜空间噪声,随去噪轨迹自然编织为生成图像纹理
Overview
内生水印(In-Generation Watermarking)区别于传统后处理(Post-hoc)水印。核心思想是利用 DDIM 的确定性与可逆性,通过调制初始高斯潜噪声的空间或频域结构来嵌入水印比特。去噪网络将初始噪声中的扰动自然编织为图像/视频的高维时空语义纹理,使水印与内容融为一体。
核心技术原理
噪声即水印 (Noise-as-Watermark, NaW)
- 嵌入:调制初始潜噪声 \(z_T\)(空间或频域),输入扩散模型生成内容
- 提取:VAE 编码器将图像映射回潜空间 → DDIM Inversion 重构初始噪声 → 解调算子解码水印
- 优势:抗编辑/重采样,理论上对生成画质无损伤
四类主流调制方案
| 方法 | 调制方式 | 抗性 | 画质影响 |
|---|---|---|---|
| Tree-Ring (→ tree-ring-watermarks) | 频域环形系数替换 | RST 不变 | 低频可能偏色 |
| VideoShield (→ videoshield) | 条件截断高斯采样 | 时空篡改定位 | 无偏标准高斯保持 |
| VideoMark (→ videomark) | PRC 纠错符号调制 | 丢帧/压缩 | 完全无畸变 |
| SKeDA (→ skeda) | 置换群 Shuffle-Key | 时域去同步 | 完全无畸变 |
密钥置乱机制
- 置换群置乱 (SKe):对称群置换算子,消除帧间自相关泄露
- 滑动窗口偏移 (VideoMark):超长母版序列 + 随机起始偏移 + 编辑距离对齐
- 对比传统置乱(Arnold, Josephus, DNA):SKe/滑窗 无画质影响、抗时域去同步
视频压缩补偿
- 差分注意力 (DA):相邻帧特征差分构建时域潜在差分图,衰减 P/B 帧量化噪声的注意力响应
- HSTR:级联时间/空间细化器,恢复剪辑重排 + 滤除运动漂移
- TMM:编辑距离比对,恢复滑窗对齐
多尺度方法
- WaTeRFlow:光流引导 TCL 损失,跨模态生成保持运动一致
- GenPTW:跨注意力融合 + 多尺度拉普拉斯高频敏感,抗复合攻击
Related
- tree-ring-watermarks — Tree-Ring 频域环形水印
- videoshield — VideoShield 条件截断高斯采样 (ICLR 2025)
- videomark — VideoMark PRC 纠错符号调制
- skeda — SKeDA 置换群置乱 + 差分注意力
- dtr-ringet — DTR/RINGet 动态年轮视频水印
- genptw — GenPTW 潜空间内生水印
- img-wm-diffusion — 扩散模型水印综述
Sources
- diffision watermark.pdf — 2026-05-28