Los mejores generadores de arte de IA 2024 que debes conocer

Con los mejores generadores de arte de IA, lo que antes le tomaba horas a un diseñador gráfico para perfeccionar, ahora se puede producir en cuestión de minutos. Los ames o los odies, estos programas están aquí para quedarse. Y en el espacio de solo un año más o menos, la calidad de su producción ha mejorado drásticamente.


Con muchas de estas herramientas de IA ahora en su segunda o tercera iteración, son cada vez más capaces de crear obras de arte increíbles basadas en nada más que unas pocas líneas de texto. Si bien es poco probable que los generadores de arte de IA reemplacen por completo a los artistas y creadores digitales, ya han aparecido en los titulares con imágenes fotorrealistas lo suficientemente buenas como para ganar concursos y engañar al ojo inexperto.

Podría decirse que más emocionante que imitar imágenes reales es la capacidad de estas herramientas de IA para producir imágenes surrealistas y estilizadas, o para reimaginar obras existentes de una manera nueva. 

¿Te animas a probarlo? 

Hemos probado algunos de los mejores generadores de arte de IA y hemos compartido nuestra experiencia a continuación. Hemos explicado cómo usarlos, en qué son buenos y para quién podría ser mejor cada programa, y también hemos incluido ejemplos del tipo de trabajo que pueden producir, para que puedas juzgar por ti mismo.

{getCard} $type={post} $title={Recomendado}

Generadores de arte de IA 2024

Dall-E 3 (OpenAI), El generador de arte de IA mejor pagado para principiantes

Dall-E de OpenAI fue el primer generador de arte de IA que atrajo la atención generalizada. Su tercera iteración supera aún más los límites, procesando indicaciones de texto complejas para producir imágenes dinámicas en una variedad de estilos. Las herramientas de edición selectiva también facilitan aún más el ajuste de los resultados generados por IA.

En las pruebas, descubrimos que este es uno de los generadores de arte de IA más fáciles de usar. Accedido a través de una suscripción a ChatGPT Plus (20 dólares al mes), la creación de imágenes es tan simple como escribir indicaciones de palabras en el cuadro de texto. 

Los tiempos de espera pueden variar, pero el resultado suele aparecer en 30 segundos. A diferencia de Dall-E 2, las dimensiones ya no están limitadas a 1024x1024: ahora puede solicitar una imagen de paisaje (1024x1792) o vertical (1792x1024), lo que aumenta su versatilidad.

Puede generar más variaciones repitiendo o modificando su mensaje de texto. Para editar una imagen en particular, simplemente ábrala y escriba en la sección "Editar imagen..." cuadro de texto. Ahí también es donde puede usar la herramienta de selección para pintar sobre un área específica de la imagen, para orientar sus solicitudes de edición.

En general, los resultados fueron impresionantes y utilizables. Dall-E 3 es capaz de producir imágenes atractivas en varios estilos. En nuestra experiencia, por defecto tiene un aspecto fotorrealista estilizado. 

Esto no es malo: las imágenes son perceptiblemente generadas por computadora, pero la estética tiende a ser rica y vibrante. Dicho esto, también le fue bastante bien cuando nuestro aviso especificó papel doblado e ilustración dibujada a mano como estética

Descubrimos que Dall-E 3 es el más confiable cuando se producen gráficos basados en indicaciones de texto completas, especialmente aquellos que cuentan una historia. Era menos eficaz a la hora de seguir peticiones específicas, como un aviso para eliminar autobuses de una escena callejera o para añadir un pavo real a una imagen de la jungla.

La verdadera belleza de Dall-E 3 es cómo te anima a experimentar, tanto en la creatividad de tu mensaje original como en el proceso de edición basado en texto, lo que hace que sea rápido y fácil producir obras de arte de calidad generadas por IA. Sus herramientas adicionales, incluida la capacidad de cargar imágenes como material de origen para estilos artísticos, también ofrecen mucho margen para aquellos que quieran profundizar en las habilidades de Dall-E 3.

Si bien el fotorrealismo genuino no es su punto fuerte, podríamos ver a Dall-E 3 reemplazando la suscripción a un servicio de fotografía de archivo, especialmente si necesita acceso rápido a imágenes específicas para marketing o redes sociales.

Midjourney , la mejor para usuarios avanzados

Midjourney está integrado en Discord, una plataforma social a la que se puede acceder a través de su navegador web o descargar como una aplicación para Windows, Mac, iOS y Android. Para aquellos que ya están familiarizados con Discord, esto lo convierte en una manera fácil de comenzar a crear imágenes generadas por IA. Para aquellos que no lo son, la experiencia del usuario puede parecer más compleja que la de Dall-E 3.

En la aplicación web de Discord, te unes a una sala de chat donde puedes ver las creaciones de otros usuarios en una transmisión en vivo. Para crear el suyo propio, escriba /imagine, seguido de las indicaciones de palabras que elija en el hilo de mensajes. Aproximadamente un minuto después, la imagen resultante aparece en el feed, con cuatro opciones condensadas en una imagen de 1024x1024 que se puede abrir en el navegador y descargar.

Expanda la imagen resultante para ver las opciones de mejora y variación de cada una de las cuatro imágenes. Por ejemplo, al seleccionar U1 se aumenta la escala de la imagen superior izquierda a una sola imagen de 1024 x 1024 píxeles, mientras que V4 solicita otras cuatro variaciones de la imagen generada.

El proceso es más complicado que otros generadores, pero es más probable que se ajuste más rápido para obtener un resultado satisfactorio: esas variaciones de una imagen mantienen los atributos del original, pero en un retrato, por ejemplo, pueden incluir un ligero cambio en la expresión facial.

Cuesta un poco acostumbrarse a todo, y la presencia de las creaciones de otros usuarios tiene sus pros y sus contras. A su favor, el lado social de Discord puede ser inspirador. En el lado negativo, el flujo constante puede ser una distracción y frustración si simplemente quieres seguir creando, sin perder tus propias creaciones en el éter de la sala de chat. También existe el riesgo de estar expuesto a contenido no deseado.

En términos de calidad de imagen, Discord ha avanzado a pasos agigantados desde que se lanzó por primera vez, y es capaz de generar la salida más fotorrealista de los generadores de arte presentados aquí. Las imágenes tienen una claridad, nitidez y saturación superiores. Dicho esto, la aplicación lucha por mantener la realidad todo el tiempo: ninguna cantidad de indicaciones de palabras parece capaz de anular el algoritmo que favorece un brillo de hora dorada demasiado saturado en los paisajes.

Aún así, en plataformas como Instagram, donde gran parte de la fotografía ya es hiperestilizada, las imágenes de Midjourney pueden encajar perfectamente. Ya hemos visto cuentas virales que resultan ser fraudes de IA. Si lo único que importa es que la imagen final sea de alta claridad, Midjourney es la herramienta más poderosa disponible. 

Los planes comienzan en $ 10 por mes, aunque deberá gastar más para aumentar los límites de trabajo y aumentar el tiempo de GPU. Esto es elevado en comparación con la competencia, pero sigue siendo un buen valor para aquellos que se toman en serio la adopción de la generación de imágenes con IA.

Razones para comprar

+Potente herramienta de IA

+Genera imágenes fotorrealistas

+El formato de sala de chat fomenta la creatividad

Razones para evitarlo

-Solo disponible a través de Discord

-La experiencia del usuario es confusa al principio

-Se acabaron las pruebas gratuitas

Stable Diffusion, la mejor calidad-Precio

Stable Diffusion es un modelo de generación de arte disponible bajo varias formas. Su forma más simple es la aplicación web Stable Diffusion, pero hay más profundidad en la aplicación web beta DreamStudio de Stability AI. A principios de este año, se actualizó para usar SDXL v1.0, la última versión del modelo de generación de imágenes.

En términos de facilidad de uso y calidad de salida, descubrimos que DreamStudio se encuentra en algún lugar entre Dall-E 3 de OpenAI y Midjourney en Discord. Tiene una interfaz de usuario independiente como Dall-E 3, donde puede ingresar indicaciones de palabras y refinar los resultados. Hay más opciones con las que jugar en DreamStudio: puedes ajustar la escala y las dimensiones de la imagen de salida, por ejemplo, así como el recuento de imágenes y el grado de ajustación de los resultados a tu mensaje.

El worklow es más sencillo que el de Dall-E 3, ya que todas las imágenes generadas aparecen en un solo feed, en lugar de agruparse por conversación en ChatGPT. Las opciones de edición también son menos precisas. Puede agregar nuevas capas de solicitud en cuadros sobre la imagen original, pero descubrimos que estas no se integran a la perfección, y no obtiene el mismo control granular que ofrece la herramienta de pincel de Dall-E 3.

Razones para comprar

+Podría decirse que es el mejor todoterreno

+Se puede utilizar de forma gratuita

+Utiliza el último modelo de SDXL

Razones para evitarlo

-Un poco más complejo que Dall-E 3

-Puede tener problemas con imágenes fotorrealistas

-Capacidades de archivado limitadas

Existen similitudes en la calidad de salida entre Dall-E 3 y Stable Diffusion. En nuestra experiencia, ambos se quedan cortos a mitad de camino en lo que respecta al fotorrealismo, aunque el último modelo de imagen de Stable Diffusion ha mejorado las cosas. Las imágenes que aparecen no dejan de sorprender. 

La mayoría son surrealistas y perceptiblemente generados por computadora. Las solicitudes más complejas a menudo dan como resultado resultados inutilizables.

Por ejemplo, el mensaje "persona paseando al perro en la playa, mares en calma, huellas en la arena, amanecer", arrojó una serie de resultados, incluidos varios perros, algunos a los que les faltaban extremidades, un hombre caminando sobre el agua, etc. Por el contrario, el simple "retrato fotorrealista de una persona en una playa" generó imágenes que, aunque claramente no eran fotorrealistas, tenían más calidad artística.

Obtienes 25 créditos gratis cuando te registras en DreamStudio, suficientes para alrededor de 125 imágenes. Si tiene cada solicitud configurada para generar cuatro resultados, pronto los usará. Puedes comprar 1.000 más por 10 dólares, lo que te da otras 5.000 imágenes con las que jugar. Esto significa que la barrera de entrada es baja con DreamStudio. 

Puede comenzar a usarlo de forma gratuita y recargar sus créditos cuando lo necesite, aunque los usuarios avanzados podrían descubrir rápidamente que los costos se acumulan.

{getCard} $type={post} $title={Recomendado}

ImageFX , fotorealismo gratuito

Construido en torno al modelo Imagen 2 de Google, ImageFX es un generador de imágenes de IA experimental que está disponible a través de AI Test Kitchen de Google. Desde su interfaz intuitiva hasta la calidad de sus resultados, creemos que está a la altura de los mejores generadores de IA de esta lista.

Como siempre, todo comienza con una indicación de palabras. Describa lo que desea ver y Google tardará unos segundos antes de presentarle un conjunto de cuatro variaciones de imágenes cuadradas basadas en su texto. La consistencia y la calidad de estos por sí solos distinguen a ImageFX. De todos los generadores que hemos probado, descubrimos que ImageFX se adhiere más estrechamente a la indicación dada. 

Los diferentes estilos artísticos se manejan con maestría, desde acuarelas hasta bocetos a pluma y tinta, mientras que su fotorrealismo se encuentra entre los mejores que hemos encontrado en cualquier aplicación.

Por ejemplo, el mensaje "un coche clásico en una carretera francesa, filmado en película de 35 mm, está lloviendo pero el cielo está brillante, hay un perro en el asiento delantero" generó imágenes de exactamente eso, que, sin mirar demasiado de cerca los detalles confusos de la matrícula, podrían pasar fácilmente por una foto vintage genuina.

Además, ImageFX tiene una de las interfaces más utilizables de cualquier generador de imágenes de IA. Google identifica automáticamente los elementos clave de cada mensaje, convirtiéndolos en menús desplegables que le brindan opciones para refinar sus instrucciones. 

Para "foto", por ejemplo, las alternativas eran "pintura", "dibujo" y "escultura". ImageFX también ofrecerá sugerencias más amplias para estilos artísticos debajo de su indicación, desde "mínimo" hasta "esquemático". Esto va más allá de un simple agarrotamiento: estas sugerencias nos han resultado realmente útiles para estimular nuevas ideas.

{getCard} $type={post} $title={Recomendado}

Las herramientas de edición son igualmente impresionantes. Puede enmascarar áreas particulares de una imagen con una herramienta de pincel antes de describir cualquier cambio que desee realizar. Desde nuestro tiempo usando ImageFX, estas ediciones se integran rutinariamente muy bien, dependiendo de la complejidad de su solicitud.

Su función de biblioteca también es completa. Durante una sesión, puede desplazarse por las indicaciones recientes. Para ver las imágenes que has generado anteriormente, ve a Mi biblioteca haciendo clic en la imagen de tu cuenta. Aquí encontrarás todas las variaciones que hayas hecho con ImageFX. Haga clic en uno y se cargará el mensaje completo, incluida la opción de refinar y editar la imagen.

Solo hay dos inconvenientes con ImageFX, y son menores. En primer lugar, estás limitado a imágenes cuadradas. En segundo lugar, no puedes usar imágenes como indicaciones. Pero para un generador gratuito que hace tanto tan bien, es muy difícil encontrar fallas.

¿Qué es un generador de arte de IA?

Un generador de arte con IA es un programa informático que crea imágenes digitales, como ilustraciones, pinturas o fotos, a partir de indicaciones de palabras. Los usuarios proporcionan instrucciones basadas en texto para una imagen, describiendo lo que les gustaría ver y en qué estilo. Estas preferencias son procesadas por la inteligencia artificial para crear una representación.

¿Cómo funciona un generador de arte con IA?

En términos simples, los generadores de arte de IA observan mucho arte, aprenden de él y usan ese "conocimiento" para crear nuevo arte.

Las imágenes se generan utilizando una red neuronal, una serie de algoritmos que buscan reconocer las relaciones en los datos, para imitar cómo funciona el cerebro humano. Para ello, los algoritmos (o modelos) se entrenan con millones de imágenes extraídas de internet. Los estudia para entender detalles, estilos y patrones.

Cuando le pides a un generador de arte de IA que cree una nueva imagen, se basa en estos datos para intentar crear algo nuevo. Además, la IA mejora con los comentarios de los usuarios. Si informa que algo no se ve del todo bien en una imagen, o le pide que refine algo, agregará esa retroalimentación a su banco de datos. Con el tiempo, la calidad mejora y los resultados se vuelven más precisos y confiables.

¿Son éticos los generadores de arte de IA?

La controversia rodea a los generadores de arte de IA. Existe incertidumbre sobre cómo se obtienen las imágenes y de dónde. Para dar un ejemplo, los procedimientos legales de Getty contra Stability AI, afirman que la compañía de IA "copió y procesó ilegalmente millones de imágenes protegidas por derechos de autor".

A nivel de usuario, ha habido ejemplos repetidos del uso de la IA para generar imágenes fotorrealistas que no se divulgan, y del uso manipulador de imágenes generadas por la IA para el fraude; Además, por supuesto, de la proliferación de imágenes 'deep fake', que nos llevan a cuestionar qué es real y qué no lo es.