Google dice que Imagen 3 es superior a DALL-E 3. Cómo probarlo tú mismo
Con tantos chatbots de IA en el mercado, elegir el mejor puede resultar complicado. Para intentar zanjar el debate, Google DeepMind realizó una comparación entre los principales chatbots y descubrió que los usuarios quedaron especialmente impresionados con el software de creación de imágenes Imagen 3.
Además: acabo de probar el generador de imágenes ImageFX AI de Google y me sorprende lo bueno que es.
A un informeUn estudio publicado el miércoles muestra cómo Google DeepMind evaluó el rendimiento de Imagen 3 frente a su predecesor, Imagen 2, y modelos líderes de terceros, incluidos DALL-E 3, Midjourney v6, Stable Diffusion 3 Large y Stable Diffusion XL 1.0, en Evaluaciones humanas y automatizadas.
Las evaluaciones humanas probaron cinco aspectos cualitativos de los modelos de generación de texto a imagen: preferencia, alineación rápida de imágenes, atractivo visual, alineación rápida detallada de imágenes y razonamiento numérico.
En la categoría de preferencia general, que mide la satisfacción del usuario con la imagen en comparación con el mensaje de entrada, Imagen 3 ganó por un amplio margen sobre la competencia, como se muestra en la siguiente imagen:
Imagen 3 tuvo un desempeño competitivo en otras categorías de evaluación humana, así como en evaluaciones automatizadas, que probaron la alineación instantánea de la imagen (nuevamente) y la calidad de la imagen.
Además: Google AI Overviews recibirá tres actualizaciones útiles. Esto es lo nuevo
“En general, Imagen 3 sobresale claramente en alinear la imagen con las indicaciones, especialmente en lo que respecta a indicaciones detalladas y capacidades de conteo; mientras que Midjourney v6 lidera en términos de atractivo visual, Imagen 3 ocupa el segundo lugar”, concluyó el informe.
“Al considerar todos los aspectos de la calidad, Imagen 3 claramente encabeza nuestra lista general de preferencias, lo que indica que logra el mejor equilibrio entre resultados de alta calidad que respetan la intención del usuario”.
¿Suena esto demasiado bueno para ser verdad? Aquí se explica cómo probar Imagen 3 en ImageFX, una herramienta de Google Labs que permite a las personas crear imágenes utilizando indicaciones de texto simples.
ImageFX está disponible a través de Google Labs, la plataforma de la empresa para probar ideas y productos. Como ocurre con todos los demás experimentos de Google Labs, el acceso a la herramienta es fácil y gratuito.
Todo lo que tienes que hacer es visitar Google Labs y seleccionar ImageFX o visitar Página de efectos de imagen Inicie sesión directamente en su cuenta personal de Google y comience a utilizar la herramienta. Al igual que con cualquier otra herramienta de conversión de texto a imagen, escribe un mensaje de conversación sobre lo que te gustaría ver.
Además: Los mejores generadores de imágenes de IA de 2024: probados y revisados
Un beneficio adicional de ImageFX es su característica lúdica: una interfaz rápida que incluye “diapositivas emoji” que puedes usar para experimentar “las dimensiones adyacentes de tu creatividad e ideas”, según Google. Una vez que escribe un mensaje, aparece un botón de alternancia sobre las palabras seleccionadas del mensaje, sugiriendo formas nuevas y divertidas de editarlo.
Cada generación proporcionará cuatro imágenes de alta calidad que podrás disfrutar. En mi experiencia, ImageFX incluso proporcionó buenos resultados. Las manos suelen ser un tema difícil para los creadores de imágenes.
“Alborotador. Amante de la cerveza. Total aficionado al alcohol. Sutilmente encantador adicto a los zombis. Ninja de twitter de toda la vida”.