当前路径:/wiki/page/diffusion-in-generation-wm
返回首页索引

扩散模型内生水印 (In-Generation Watermarking)

Noise-as-Watermark (NaW) 范式:将水印嵌入 DDIM 初始潜空间噪声,随去噪轨迹自然编织为生成图像纹理

Overview

内生水印(In-Generation Watermarking)区别于传统后处理(Post-hoc)水印。核心思想是利用 DDIM 的确定性与可逆性,通过调制初始高斯潜噪声的空间或频域结构来嵌入水印比特。去噪网络将初始噪声中的扰动自然编织为图像/视频的高维时空语义纹理,使水印与内容融为一体。

核心技术原理

噪声即水印 (Noise-as-Watermark, NaW)

  1. 嵌入:调制初始潜噪声 \(z_T\)(空间或频域),输入扩散模型生成内容
  2. 提取:VAE 编码器将图像映射回潜空间 → DDIM Inversion 重构初始噪声 → 解调算子解码水印
  3. 优势:抗编辑/重采样,理论上对生成画质无损伤

四类主流调制方案

方法 调制方式 抗性 画质影响
Tree-Ring (→ tree-ring-watermarks) 频域环形系数替换 RST 不变 低频可能偏色
VideoShield (→ videoshield) 条件截断高斯采样 时空篡改定位 无偏标准高斯保持
VideoMark (→ videomark) PRC 纠错符号调制 丢帧/压缩 完全无畸变
SKeDA (→ skeda) 置换群 Shuffle-Key 时域去同步 完全无畸变

密钥置乱机制

  • 置换群置乱 (SKe):对称群置换算子,消除帧间自相关泄露
  • 滑动窗口偏移 (VideoMark):超长母版序列 + 随机起始偏移 + 编辑距离对齐
  • 对比传统置乱(Arnold, Josephus, DNA):SKe/滑窗 无画质影响、抗时域去同步

视频压缩补偿

  • 差分注意力 (DA):相邻帧特征差分构建时域潜在差分图,衰减 P/B 帧量化噪声的注意力响应
  • HSTR:级联时间/空间细化器,恢复剪辑重排 + 滤除运动漂移
  • TMM:编辑距离比对,恢复滑窗对齐

多尺度方法

  • WaTeRFlow:光流引导 TCL 损失,跨模态生成保持运动一致
  • GenPTW:跨注意力融合 + 多尺度拉普拉斯高频敏感,抗复合攻击

Sources