Découvrez comment fonctionne un réseau antagoniste génératif (GAN), à quoi il sert et découvrez-en des exemples dans ce guide adapté aux débutants.
Read in English (Lire en anglais).
Un modèle d'apprentissage automatique est un algorithme qui reconnaît des modèles dans les informations. Ces modèles sont formés sur un ensemble de données et guidés par des instructions appelées algorithme d'apprentissage automatique. Les modèles d'apprentissage automatique peuvent être utilisés pour automatiser les processus de prise de décision répétitifs, trier les informations, créer de nouveaux échantillons de données et faire des prédictions.
Par exemple, supposons que vous souhaitiez entraîner une caméra de sécurité domestique à reconnaître certaines personnes. Vous pouvez fournir au modèle un ensemble de données d'entraînement composé de photos de votre famille, en les étiquetant comme non menaçantes. Un algorithme d'apprentissage automatique peut demander à la caméra de ne pas émettre d'alertes de sécurité lorsqu'elle détecte une personne incluse dans l'ensemble de données non menaçantes. Désormais, au lieu de recevoir des alertes de sécurité pour chaque mouvement détecté, vous ne recevrez des alertes de sécurité que pour les détections de mouvement causées par des personnes extérieures à votre famille.
GAN signifie « réseau antagoniste génératif » (Generative Adversarial Network).
Il s'agit d'un type de modèle d'apprentissage automatique appelé réseau neuronal, spécialement conçu pour imiter la structure et le fonctionnement d'un cerveau humain. Pour cette raison, les réseaux neuronaux de l'apprentissage automatique sont parfois appelés réseaux neuronaux artificiels (RNA). Cette technologie est à la base de l'apprentissage profond, une sous-catégorie de l’apprentissage automatique (Machine Learning) capable de reconnaître des modèles complexes dans différents types de données tels que des images, des sons et du texte.
Apprenez-en plus sur les applications concrètes des GAN dans cette conférence du cours Spécialisation en Réseaux Antagonistes Génératifs (GAN) de DeepLearning.AI :
Les neurones de votre cerveau sont des cellules qui utilisent des substances chimiques et des signaux électriques pour envoyer des informations entre différentes parties de votre cerveau et de votre corps. Les neurones des modèles d'apprentissage automatique sont des modules logiciels qui s'envoient des informations et des calculs.
Les modèles génératifs peuvent générer de nouveaux échantillons de données en interprétant la manière dont les données sont placées en plus de ce que les données représentent. En revanche, les modèles discriminatifs se concentrent sur la différenciation des échantillons de données existants.
Les modèles génératifs sont constitués de deux types de réseaux neuronaux :
1. Générateur. Les générateurs sont des réseaux neuronaux convolutifs (CNN, pour Convolutional Neural Networks), un type d'algorithme d'apprentissage profond qui peut traiter une image d'entrée, différencier les objets qu'elle contient et attribuer une importance à chacun d'eux. Ces degrés d'importance sont appelés pondérations. Un réseau générateur vise à créer des sorties qui pourraient être confondues avec des données réelles.
2. Discriminateur. Les discriminateurs sont des réseaux neuronaux déconvolutifs (DNN, pour Deconvolutional Neural Networks). Ces algorithmes fonctionnent à l'inverse des CNN, en visant à identifier les caractéristiques d'une entrée qui ont été soit manquées par le CNN, soit mélangées avec d'autres signaux. Un réseau discriminateur vise à identifier quelle sortie reçue est artificielle.
Dans le contexte des GAN, le terme « antagoniste » décrit l’environnement d’entraînement de chaque réseau neuronal (DNN et CNN).
Lors de l'entraînement, les réseaux générateur et discriminateur s'affrontent dans un jeu de bluff. Le générateur crée des échantillons de données artificiels, comme de fausses images, pour tromper le discriminateur et le convaincre de les accepter comme authentiques. En réponse, le discriminateur tente d'identifier quels échantillons de données sont de vraies images et lesquels ne le sont pas. Ils pratiquent ce jeu encore et encore, chacun améliorant son travail à chaque fois.
Supposons que vous ayez fourni cette ligne de caractères à un modèle discriminatif et à un modèle génératif :
^ ⌄ ^ ⌄ ^ ⌄
Un modèle génératif peut prédire la probabilité qu'une flèche vers le bas apparaisse ensuite dans la file. Un modèle discriminatif peut décider quels symboles sont orientés vers le haut et lesquels sont orientés vers le bas. Bien que le modèle génératif reconnaisse également quelles flèches sont orientées dans quelle direction, il pousse son analyse plus loin en attribuant une probabilité à une séquence de symboles. Les modèles discriminatifs se concentrent plutôt sur la probabilité que les étiquettes « vers le haut » et « vers le bas » s'appliquent à chaque symbole.
Les chercheurs continuent de trouver de nouveaux cas d'utilisation des réseaux antagonistes génératifs et d'améliorer les techniques GAN existantes. Voici quelques exemples de différents types de GAN :
CycleGAN : Les réseaux antagonistes génératifs de type CycleGAN se concentrent sur les traductions d'image à image. L'ensemble de données d'apprentissage se compose de deux ensembles de données non appariés ou de groupes d'images sans étiquettes ni correspondances. Le CycleGAN utilise ces informations pour apprendre à transformer des images d'un ensemble en images qui pourraient passer pour appartenir à l'autre ensemble. Par exemple, supposons que vous ayez fourni à un CycleGAN deux ensembles d'images : l'un représentant des chats domestiques et l'autre des tigres. Le résultat pourrait ressembler à une image réaliste d'un chat domestique avec des rayures de tigre. Ou à l'inverse, pourrait représenter un tigre de la taille d'un chat domestique.
GAN super-résolution : Les SRGAN (super-resolution GANs) ont pour but d’augmenter la résolution d'une image en remplissant les détails des zones floues d'une image. Ils y parviennent en utilisant la fonction de perte perceptuelle, une technique qui mesure la différence entre les caractéristiques perceptuelles de haut niveau de deux images. Cette technique permet de convertir une image basse résolution en une image haute résolution.
Avantages des GAN | Inconvénients des GAN |
---|---|
Les GAN sont considérés comme des modèles d’apprentissage non supervisés, qui continuent à s’entraîner après l’entrée initiale et sont capables d’apprendre à partir de données non étiquetées. | Ils peuvent être difficiles à former en raison du besoin d’ensembles de données volumineux, variés et avancés. |
Les GAN sont capables d’identifier les anomalies sur la base de mesures indiquant à quel point le générateur et le discriminateur sont capables de modéliser les données. | Il peut être difficile d’évaluer les résultats en fonction de la complexité d’une tâche donnée. |
Capacité à créer des échantillons de données réalistes | Les GAN souffrent du « mode collapse » (« effondrement de mode »), ce qui signifie qu’ils tendent à ne produire qu'une seule sortie en raison de sa grande plausibilité et de sa capacité à tromper le discriminateur. |
Si vous débutez dans l’apprentissage automatique, vous pourriez envisager de commencer par un cours en ligne adapté aux débutants.
Vous pouvez apprendre à créer et à former des modèles d'apprentissage automatique en seulement deux mois avec la Spécialisation en Apprentissage Automatique proposée par l'Université de Stanford et DeepLearning.AI.
Si vous connaissez déjà les modèles d'apprentissage automatique et souhaitez en savoir plus sur les GAN, vous préférerez peut-être un programme de niveau intermédiaire comme la Spécialisation en Réseaux Antagonistes Génératifs (GAN) proposée par DeepLearning.AI. Vous acquerrez une meilleure compréhension des composants GAN, comparerez les modèles génératifs et créerez vos propres GAN de base à l'aide de PyTorch.
Équipe éditoriale
L’équipe éditoriale de Coursera est composée de rédacteurs, de rédacteurs et de vérificateurs de fai...
Ce contenu a été mis à disposition à des fins d'information uniquement. Il est conseillé aux étudiants d'effectuer des recherches supplémentaires afin de s'assurer que les cours et autres qualifications suivis correspondent à leurs objectifs personnels, professionnels et financiers.