Stable Difussion, generador open source de imágenes a partir de texto

Hace unas semanas subimos el primer artículo relacionado con las IAs y el arte. En él os contábamos acerca de Stable Diffusion y la revolución que suponía un modelo Open Source de generación de imágenes. Hoy, vamos a ampliar aún más esta información poniendo a disposición de todos los lectores una manera sencilla de usarlo desde nuestra casa.

¿Qué necesitamos?

Una cuenta de Google y otra de https://huggingface.co (lugar donde podremos encontrar el modelo entrenado de Stable Diffusion). Una vez tengamos ambas, aprovecharemos la plataforma de Google y el notebook de @altryne que nos permite configurar de manera sencilla todo lo necesario para poder utilizar el modelo desde nuestro ordenador.

Welcome to Stable Diffusion WebUI 1.4

El primer paso será copiar el notebook a nuestro Google Drive, por si queremos cacharrear en más profundidad, y posteriormente, nos conectaremos al entorno.

Después iremos recorriendo las celdas una a una y siguiendo las instrucciones.

En la celda 1.4 tendremos que descargar el modelo y generar la estructura de carpeta que nos indica el notebook para almacenarlo en /models. Además, tendremos que recoger el token de nuestra cuenta de huggingface.co.

Una vez finalizado los pasos del bloque 1, seguiremos recorriendo las celdas de los bloques 2 y 3. Al final, en el bloque 3 veremos algo parecido a esto:

Última celda y link a la interfaz de usuario

Aquí, haremos click en la URL pública y llegaremos al entorno de usuario donde podremos comenzar a generar nuestras imágenes a partir de texto.

Una vez que lleguemos a este paso podremos configurar el tamaño de nuestra imagen, redactar el texto, modificar cuántas imágenes nos proporciona por cada prompt, los pasos que da, etc.

La interfaz ofrece más modelos, uno para generar una imagen a partir de otra, otro para añadir texto+prototipo y obtener una imagen, y el cuarto que nos ayudaría a aumentar la resolución y calidad de las imágenes.

Conclusiones

En definitiva encontramos una herramienta muy buena, sencilla de manejar y al alcance de todo el mundo que permite poder probar modelos de primer nivel. Esto abre las puertas a gente con gran imaginación/curiosidad y pocas o nulas capacidad de dibujo (como es mi caso) a crear nuevos mundos, diseños y encontrar nuevas fuentes de inspiración.

Stable Difussion, generador open source de imágenes a partir de texto

¿Qué necesitamos?

Welcome to Stable Diffusion WebUI 1.4

Conclusiones

dbd7639c7862cbac

test123123

Future Space y WeMind Cluster impulsan la innovación basada en datos en salud mental y envejecimiento

De Concepto a Badge: Innovaciones y Retos en C1B3RTR4CKS

OSINT contra el robo y la falsificación de artículos de lujo

SÍGUENOS

Comparte el artículo

Post Relacionados

La Inteligencia Artificial en España: La transformación Digital en Salud, Agricultura y Manufactura

Casos de uso de los Large Language Models

Digitalización y monitoreo en tiempo real de contadores analógicos en barcos

Una nueva generación de servicios tecnológicos y productos para nuestros clientes

Sobre Future

Mundo Future

Tendencias

Canal del Informante