Hace unas semanas subimos el primer artículo relacionado con las IAs y el arte. En él os contábamos acerca de Stable Diffusion y la revolución que suponía un modelo Open Source de generación de imágenes. Hoy, vamos a ampliar aún más esta información poniendo a disposición de todos los lectores una manera sencilla de usarlo desde nuestra casa.
¿Qué necesitamos?
Una cuenta de Google y otra de https://huggingface.co (lugar donde podremos encontrar el modelo entrenado de Stable Diffusion). Una vez tengamos ambas, aprovecharemos la plataforma de Google y el notebook de @altryne que nos permite configurar de manera sencilla todo lo necesario para poder utilizar el modelo desde nuestro ordenador.
Welcome to Stable Diffusion WebUI 1.4
El primer paso será copiar el notebook a nuestro Google Drive, por si queremos cacharrear en más profundidad, y posteriormente, nos conectaremos al entorno.
Después iremos recorriendo las celdas una a una y siguiendo las instrucciones.
En la celda 1.4 tendremos que descargar el modelo y generar la estructura de carpeta que nos indica el notebook para almacenarlo en /models. Además, tendremos que recoger el token de nuestra cuenta de huggingface.co.
Una vez finalizado los pasos del bloque 1, seguiremos recorriendo las celdas de los bloques 2 y 3. Al final, en el bloque 3 veremos algo parecido a esto:
Aquí, haremos click en la URL pública y llegaremos al entorno de usuario donde podremos comenzar a generar nuestras imágenes a partir de texto.
Una vez que lleguemos a este paso podremos configurar el tamaño de nuestra imagen, redactar el texto, modificar cuántas imágenes nos proporciona por cada prompt, los pasos que da, etc.
La interfaz ofrece más modelos, uno para generar una imagen a partir de otra, otro para añadir texto+prototipo y obtener una imagen, y el cuarto que nos ayudaría a aumentar la resolución y calidad de las imágenes.
Conclusiones
En definitiva encontramos una herramienta muy buena, sencilla de manejar y al alcance de todo el mundo que permite poder probar modelos de primer nivel. Esto abre las puertas a gente con gran imaginación/curiosidad y pocas o nulas capacidad de dibujo (como es mi caso) a crear nuevos mundos, diseños y encontrar nuevas fuentes de inspiración.