GauGAN, llamado así por el pintor postimpresionista Paul Gauguin, crea imágenes fotorrealistas a partir de mapas de segmentación, que son bocetos etiquetados que representan el diseño de una escena.
Los artistas pueden usar herramientas de pinceles y cubos de pintura para diseñar sus propios paisajes con etiquetas como río, roca y nube. Un algoritmo de transferencia de estilo permite a los creadores aplicar filtros, cambiando una escena diurna a la puesta del sol, o una imagen fotorrealista a una pintura.
Los usuarios incluso pueden cargar sus propios filtros para colocar en sus obras maestras, o cargar mapas de segmentación personalizados e imágenes de paisajes como base para su obra de arte.
Por lo general, una red neuronal aprende a reconocer fotos de gatos, por ejemplo, analizando decenas de miles de fotos de gatos. Pero esas fotos no se pueden usar para entrenar redes a menos que las personas etiqueten cuidadosamente lo que se muestra en cada imagen. Esa es una tarea costosa y que requiere mucho tiempo. Las GAN solucionan este problema al reducir la cantidad de datos necesarios para entrenar algoritmos de aprendizaje profundo. Y proporcionan una forma única de entrenar algoritmos de aprendizaje profundo para crear datos etiquetados, imágenes, en la mayoría de los casos, a partir de datos existentes. En lugar de entrenar una sola red neuronal para reconocer imágenes, los investigadores entrenan dos redes competidoras. Extendiendo el ejemplo del gato, una red de generadores intenta crear imágenes de gatos falsos que parecen gatos reales. Una red discriminadora examina las imágenes de los gatos e intenta determinar si son reales o falsas.