ComfyUI Image to Image: Denoise-Einstellungen & häufige Fehler
Meistere img2img in ComfyUI — verstehe Denoise-Werte, baue den Workflow korrekt auf und behebe häufige Probleme wie den Verlust von Referenzdetails.
Was ist Image to Image?
Image to Image (img2img) nimmt ein bestehendes Bild als Eingabe und erzeugt daraus ein neues Bild. Anstatt wie bei Text-to-Image von reinem Rauschen zu starten, beginnt das Modell mit einer verrauschten Version deines Referenzbildes — es behält die Struktur bei und wendet gleichzeitig neue Stile oder Details an.
Häufige Anwendungsfälle:
- Stiltransfer — ein Foto in Anime, Ölgemälde oder Skizze verwandeln
- Fotorestaurierung — alte oder beschädigte Bilder aufbereiten
- Kolorierung — Schwarz-Weiß-Fotos einfärben
- Konzeptiteration — eine grobe Skizze in ein ausgefeiltes Bild verfeinern
Unterschiede zu Text to Image
Der Workflow ist nahezu identisch mit Text-to-Image, mit zwei wesentlichen Änderungen:
- Eingabebild ersetzt leeres Latent — Anstelle eines Empty Latent Image-Knotens verwendest du einen Load Image-Knoten gefolgt von einem VAE Encode-Knoten, um deine Referenz in den Latent-Raum zu konvertieren
- Denoise muss kleiner als 1.0 sein — Das ist der entscheidende Unterschied
Der Denoise-Parameter
Der denoise-Wert im KSampler steuert, wie viel vom Originalbild das Modell beibehält:
| Denoise-Wert | Effekt |
|---|---|
| 0.0–0.3 | Subtile Änderungen — Farbverschiebungen, kleine Stilanpassungen. Das Originalbild ist klar erkennbar |
| 0.3–0.6 | Moderate Transformation — spürbare Stiländerungen bei Beibehaltung der Komposition |
| 0.6–0.8 | Starke Transformation — neue Details entstehen, die ursprüngliche Struktur wird nur grob beibehalten |
| 0.8–1.0 | Nahezu vollständige Neugenerierung — nähert sich dem Text-to-Image-Verhalten an |
| 1.0 | Praktisch identisch mit Text-to-Image — das Referenzbild hat kaum noch Einfluss |
Bei denoise 1.0 trägt das Referenzbild praktisch nichts zum Ergebnis bei. Für sinnvolles img2img sollte der Wert unter 0.9 bleiben.
Aufbau des Workflows
Schritt 1: Referenzbild laden
Füge einen Load Image-Knoten hinzu und wähle dein Eingabebild aus. Dieser ersetzt den Empty Latent Image-Knoten aus dem Text-to-Image-Workflow.
Schritt 2: In den Latent-Raum kodieren
Verbinde den Ausgang von Load Image mit einem VAE Encode-Knoten. Dieser wandelt dein Pixelbild in die Latent-Darstellung um, mit der der KSampler arbeitet.
Schritt 3: KSampler konfigurieren
Verbinde alles wie bei einem Text-to-Image-Workflow, aber:
- Setze denoise als Ausgangspunkt auf einen Wert zwischen 0.3 und 0.7
- Schreibe Prompts, die deinen gewünschten Ausgabestil beschreiben
- Das Modell verwendet dein Referenzbild als Startpunkt anstelle von reinem Rauschen
Verbindungs-Checkliste
Stelle sicher, dass diese Verbindungen bestehen, bevor du generierst:
- Load Image → VAE Encode (samples input)
- Load Checkpoint → VAE Encode (vae input) und VAE Decode (vae input)
- VAE Encode → KSampler (latent_image input)
- CLIP Text Encode (positive) → KSampler
- CLIP Text Encode (negative) → KSampler
- KSampler → VAE Decode → Save Image
Eine gute Startkonfiguration: steps 20, cfg 7.0, denoise 0.5.
Schritt 4: Generieren und iterieren
Klicke auf Queue (oder Strg+Enter) zum Generieren. Falls das Ergebnis:
- Zu nah am Original ist — erhöhe denoise
- Zu verschieden vom Original ist — verringere denoise
- Den falschen Stil hat — passe deine Text-Prompts an
Praktische Tipps
- Starte mit denoise 0.5 und passe von dort an — ein guter Mittelwert
- Dein Prompt ist weiterhin wichtig — er steuert, was das Modell während des Denoising hinzufügt
- Negative Prompts helfen — nutze sie wie bei Text-to-Image, um Artefakte zu vermeiden
- Die Auflösung ist wichtig — für SD1.5 skaliere dein Eingabebild auf 512×512 für beste Ergebnisse
- Experimentiere systematisch — probiere denoise-Werte von 0.2 bis 0.8 in 0.1er-Schritten, um den optimalen Wert zu finden
Häufige Probleme und Lösungen
Das Ergebnis sieht meiner Referenz überhaupt nicht ähnlich
- Denoise zu hoch — senke ihn auf 0.3–0.5, um mehr vom Original beizubehalten
- Falsche VAE-Verbindung — stelle sicher, dass die VAE von Load Checkpoint sowohl mit VAE Encode als auch mit VAE Decode verbunden ist
- Nicht übereinstimmende Auflösung — skaliere dein Eingabebild auf die native Auflösung des Modells (512×512 für SD1.5)
Das Ergebnis ist fast identisch mit dem Eingabebild
- Denoise zu niedrig — erhöhe auf 0.5–0.7 für mehr Transformation
- Schwacher Prompt — füge mehr beschreibende Schlüsselwörter für die gewünschte Stiländerung hinzu
Farben oder Kontrast sehen falsch aus
- Das passiert häufig, wenn die VAE deines Checkpoints nicht passt. Versuche eine externe VAE (füge einen „Load VAE"-Knoten hinzu), z. B.
vae-ft-mse-840000-ema-pruned
Das Referenzbild erscheint verzerrt
- Überprüfe, ob die Abmessungen deines Eingabebildes durch 8 teilbar sind (Anforderung des ComfyUI Latent-Raums)
- Vermeide sehr kleine Bilder (
<256px) — sie enthalten nicht genug Details, mit denen das Modell arbeiten kann
Nächste Schritte
- Text to Image — Falls noch nicht geschehen, lerne die Grundlagen
- LoRA-Leitfaden — Kombiniere img2img mit LoRA für präzise Stilkontrolle
- Upscale-Leitfaden — Verbessere deine img2img-Ergebnisse mit KI-Upscaling
Wenn dieses Problem deine echte ComfyUI-Umgebung betrifft, starte mit Wonderful Launcher, prüfe den vorhandenen Rechner und nutze die Anleitung für die eigentliche Reparaturentscheidung.
Wonderful Launcher herunterladenDid this fix your issue?
Your answer helps prioritize verified ComfyUI repairs.