Was ist GAN? Generative Adversarial Networks (GAN) einfach erklärt

Geschrieben von Coursera Staff • Aktualisiert am

Erfahren Sie in diesem anfängerfreundlichen Guide, wie GANs funktionieren, wofür sie verwendet werden und sehen Sie sich Beispiele an.

[Hauptbild] Ein Ingenieur für maschinelles Lernen in einem grauen Hemd sitzt mit dem Rücken zu seinem Schreibtisch und spricht mit Kollegen.

Read in English (Auf Englisch lesen).

Ein Machine-Learning-Modell ist eine Datei, die Muster in Informationen erkennt. Diese Modelle werden anhand eines Datensatzes trainiert und von Anweisungen, einem sogenannten Machine-Learning-Algorithmus, geleitet. Machine-Learning-Modelle können verwendet werden, um wiederkehrende Entscheidungsprozesse zu automatisieren, Informationen zu sortieren, neue Datenstichproben zu erstellen und Vorhersagen zu treffen. 

Angenommen, Sie möchten eine Überwachungskamera trainieren, um bestimmte Personen zu erkennen. Sie könnten dem Modell einen Trainingsdatensatz mit Fotos Ihrer Familie bereitstellen und diese als ungefährlich kennzeichnen. Ein Machine-Learning-Algorithmus kann die Kamera anweisen, keine Sicherheitswarnungen auszugeben, wenn sie Personen im Datensatz erkennt. Anstatt Sicherheitswarnungen für jede erkannte Bewegung zu erhalten, erhalten Sie dann nur noch Sicherheitswarnungen für Bewegungen, die von Personen außerhalb Ihrer Familie ausgelöst werden. 

Was ist GAN? Bedeutung von Gan

GAN steht für Generative Adversarial Network.

Es handelt sich um ein Modell für maschinelles Lernen, das als neuronales Netzwerk bezeichnet wird und speziell darauf ausgelegt ist, die Struktur und Funktion des menschlichen Gehirns nachzuahmen. Aus diesem Grund werden neuronale Netzwerke im maschinellen Lernen manchmal auch als künstliche neuronale Netze (KNN) bezeichnet. Diese Technologie bildet die Grundlage für Deep Learning, eine Unterkategorie des maschinellen Lernens (ML), die komplexe Muster in unterschiedlichen Datentypen wie Bildern, Tönen und Texten erkennen kann. 

Erfahren Sie in der Spezialisierung auf Generative Adversarial Networks (GANs) von DeepLearning.AI mehr über reale Anwendungen von GANs:

Menschliche Neuronen vs. künstliche Neuronen

Neuronen im Gehirn sind Zellen, die chemische und elektrische Signale nutzen, um Informationen zwischen verschiedenen Teilen des Gehirns und Körpers zu übertragen. Neuronen in Modellen des maschinellen Lernens sind Softwaremodule, die Informationen und Berechnungen untereinander austauschen. 

Platzhalter

Generative Modelle

Generative Modelle können neue Datenproben generieren, indem sie die Platzierung der Daten und deren Repräsentation interpretieren. Diskriminative Modelle konzentrieren sich dagegen auf die Unterscheidung zwischen vorhandenen Datenproben. 

Neuronale Netze

Generative Modelle bestehen aus zwei Arten neuronaler Netzwerke:

1. Generator. Generatoren sind Convolutional Neural Networks (CNN), eine Art Deep-Learning-Algorithmus, der Eingabebilder analysieren, darin enthaltene Objekte identifizieren und ihnen Bedeutungen zuweisen kann. Diese Bedeutungen werden durch sogenannte Gewichte repräsentiert. Das Ziel des Generatornetzwerks besteht darin, realistisch wirkende Ausgaben zu erzeugen, die kaum von echten Daten zu unterscheiden sind.

2. Diskriminator. Diskriminatoren sind dekonvolutionelle neuronale Netze (DNN), das im Gegensatz zum CNN arbeitet. Während CNNs Merkmale aus Bildern extrahieren, analysiert der Diskriminator die generierten Daten und versucht, künstliche Inhalte von echten zu unterscheiden. Sein Ziel ist es, zu erkennen, ob eine Eingabe vom Generator erzeugt oder aus realen Daten entnommen wurde.

Wettbewerbsbasierte Umgebung

Im Kontext von GANs beschreibt „adversarial“ die Trainingsumgebung für jedes neuronale Netzwerk (DNN und CNN).

Während des Trainings konkurrieren Generator- und Diskriminatornetzwerke in einem Bluffspiel miteinander. Der Generator erzeugt künstliche Datenproben, beispielsweise gefälschte Bilder, um den Diskriminator dazu zu bringen, sie als authentisch zu akzeptieren. Daraufhin versucht der Diskriminator zu erkennen, welche Datenproben echte Bilder sind und welche nicht. Sie üben dieses Spiel immer wieder und verbessern dabei jedes Mal ihre Rolle. 

Generative vs. diskriminative Modelle

Angenommen, Sie haben diese Zeichenfolge einem diskriminativen Modell und einem generativen Modell bereitgestellt: 

^ ⌄ ^ ⌄ ^ ⌄

Ein generatives Modell kann vorhersagen, wie wahrscheinlich es ist, dass als nächstes in der Reihe ein Abwärtspfeil erscheint. Ein diskriminatives Modell kann entscheiden, welche Symbole nach oben und welche nach unten zeigen. Das generative Modell erkennt zwar auch, welche Pfeile in welche Richtung zeigen, geht aber in seiner Analyse noch einen Schritt weiter, indem es einer Symbolfolge eine Wahrscheinlichkeit zuordnet. Diskriminative Modelle konzentrieren sich stattdessen darauf, wie wahrscheinlich die Bezeichnungen „nach oben“ und „nach unten“ auf jedes Symbol zutreffen.

Platzhalter

Arten von GANs

Forscher identifizieren weiterhin neue Anwendungsfälle für GANs und verbessern bestehende GAN-Techniken. Hier sind einige Beispiele für verschiedene GAN-Typen:

  • CycleGAN. Generative Adversarial Networks konzentrieren sich auf Bild-zu-Bild-Konvertierungen. Der Trainingsdatensatz besteht aus zwei ungepaarten Datensätzen oder Bildgruppen ohne Beschriftungen oder Korrespondenzen. Das CycleGAN nutzt diese Informationen, um zu lernen, wie Bilder aus einem Satz in Bilder umgewandelt werden, die als zum anderen Satz gehörend durchgehen. Angenommen, Sie haben einem CycleGAN zwei Bildsätze bereitgestellt: einen mit Hauskatzen und einen mit Tigern. Die Ausgabe könnte wie ein realistisches Bild einer Hauskatze mit Tigerstreifen aussehen. Oder umgekehrt könnte ein Tiger in der Größe einer Hauskatze dargestellt werden.

  • Super-Resolution-GANs. SRGANs werden trainiert, um die Bildauflösung zu erhöhen, indem sie Details in unscharfe Bildbereiche einfügen. Dies erreichen sie mithilfe der Perceptual Loss Function, einer Technik, die den Unterschied zwischen den hochaufgelösten Wahrnehmungsmerkmalen zweier Bilder misst. Diese Technik ermöglicht die Hochskalierung eines Bildes mit niedriger Auflösung zu einem Bild mit hoher Auflösung.

Vor- und Nachteile von GANs

Vorteile von GANsNachteile von GANs
GANs gelten als unüberwachte Lernmodelle, die sich nach der ersten Eingabe weiter selbst trainieren und in der Lage sind, aus nicht gekennzeichneten Daten zu lernen.Aufgrund der Notwendigkeit großer, vielfältiger und komplexer Datensätze kann das Training schwierig sein.
GANs sind in der Lage, Anomalien anhand von Messungen zu identifizieren, die anzeigen, wie gut Generator und Diskriminator die Daten modellieren können.Je nach Komplexität einer bestimmten Aufgabe kann die Auswertung der Ergebnisse eine Herausforderung darstellen.
Fähigkeit, realistische Datenbeispiele zu erstellenGANs können unter Moduskollaps leiden, bei dem das Modell aufgrund seiner hohen Plausibilität und der Fähigkeit, den Diskriminator auszutricksen, immer wieder dieselbe oder nur eine begrenzte Anzahl von Ausgaben erzeugt.

Erfahren Sie mehr über GANs mit Coursera

Wenn Sie neu im Bereich Machine Learning sind, sollten Sie über einen anfängerfreundlichen Onlinekurs nachdenken.

Mit der Spezialisierung Machine Learning der Stanford University und DeepLearning.AI können Sie in nur zwei Monaten lernen, Machine-Learning-Modelle zu erstellen und zu trainieren.

Wenn Sie bereits mit Machine-Learning-Modellen vertraut sind und mehr über GANs erfahren möchten, ist ein fortgeschrittenes Programm wie die Spezialisierung Generative Adversarial Networks (GANs) von DeepLearning.AI möglicherweise die richtige Wahl. Sie entwickeln im Zuge dieses Programms ein besseres Verständnis der GAN-Komponenten, vergleichen generative Modelle und erstellen mit PyTorch Ihre eigenen einfachen GANs. 

Weiterlesen

Aktualisiert am
Geschrieben von:

Redaktion

Das Redaktionsteam von Coursera besteht aus äußerst erfahrenen professionellen Redakteuren, Autoren ...

Diese Inhalte dienen nur zu Informationszwecken. Den Lernenden wird empfohlen, eingehender zu recherchieren, ob Kurse und andere angestrebte Qualifikationen wirklich ihren persönlichen, beruflichen und finanziellen Vorstellungen entsprechen.