diffsynth

文档介绍

  • DiffSynth-Studio 文档

上手使用

  • 安装依赖
  • 模型推理
  • 推理加速
  • 显存管理
  • 模型训练
  • 环境变量
  • GPU/NPU 支持
  • 推理 WebUI

模型详解

  • FLUX
  • Wan
  • Qwen-Image
  • FLUX.2
  • Z-Image
  • Anima
  • LTX-2
  • ERNIE-Image
  • JoyAI-Image
  • ACE-Step
  • HiDream-O1-Image
  • Stable Diffusion
  • Stable Diffusion XL
  • 图像质量评估指标

训练框架

  • Diffusion 模型基本原理
  • 标准监督训练
  • 在训练中启用 FP8 精度
  • 端到端的蒸馏加速训练
  • 两阶段拆分训练
  • 差分 LoRA 训练
  • 启用 DeepSpeed
  • Offload Training

模型接入

  • 接入模型结构
  • 接入 Pipeline
  • 细粒度显存管理方案
  • 接入模型训练

API 参考

  • diffsynth.core.attention: 注意力机制实现
  • diffsynth.core.data: 数据处理算子与通用数据集
  • diffsynth.core.gradient: 梯度检查点及其 Offload
  • diffsynth.core.loader: 模型下载与加载
  • diffsynth.core.vram: 显存管理

Diffusion Templates

  • Diffusion Templates
  • Diffusion Templates 架构详解
  • Template 模型推理
  • Template 模型训练

学术导引

  • 从零开始训练模型
  • 推理改进优化技术

常见问题

  • 常见问题
diffsynth
  • 搜索


© 版权所有 2022-2025, Alibaba ModelScope。

利用 Sphinx 构建,使用的 主题 由 Read the Docs 开发.