Google Whisk: La nueva herramienta de IA de Google que utiliza instrucciones visuales en lugar de palabras

La última herramienta de inteligencia artificial de Google, “Whisk”, permite a los usuarios subir fotografías para obtener una imagen combinada generada por inteligencia artificial sin necesidad de escribir una sola palabra.

Antes de que Whisk mezcle las fotografías, los usuarios pueden proporcionar imágenes de temas, entornos y estilos.

En una publicación de blog, Google llamó a Whisk una “herramienta creativa” para inspiración rápida, no un “editor de imágenes tradicional”. Whisk está diseñado para ser una herramienta de inteligencia artificial divertida, no profesional.

Empresas de tecnología como Google y OpenAI se apresuran a entregar productos de consumo que demuestren la increíble nueva tecnología, incluso cuando los detractores advierten que el crecimiento de la inteligencia artificial sin límites es peligroso para la humanidad.

Desde que OpenAI introdujera Dall-E, una herramienta de producción de texto a imagen, en 2021, las obras de arte generadas por inteligencia artificial han invadido las redes sociales y permeado los artículos de consumo. Google Whisk es un generador de imagen a imagen que se basa en los generadores de texto a imagen.

Los usuarios de Whisk pueden modificar sus entradas y mezclar categorías para crear peluches, pines de esmalte y pegatinas. Los usuarios pueden dirigir los detalles utilizando palabras, pero una imagen no es esencial.

“Whisk está diseñado para permitir a los usuarios remezclar un tema, una escena y un estilo de nuevas y creativas formas, ofreciendo una rápida exploración visual en lugar de ediciones perfectas de píxeles”, afirmó Thomas Iljic, director de gestión de productos de Google Labs.

Google compró DeepMind en 2014 y utilizó su inteligencia artificial generativa para construir Whisk.

Whisk utiliza el servicio principal de inteligencia artificial de Google, Gemini, introducido en diciembre de 2023, y Imagen 3, el generador de texto a imagen más nuevo de DeepMind.

Imagen 3 recibe subtítulos de Gemini cuando los usuarios publican fotografías. Para remezclar la imagen final, la técnica captura la “esencia” del tema en lugar de una reproducción exacta, lo que puede desviarse del estímulo inicial.

Google afirmó en una publicación de blog que la imagen creada puede diferir de las fotos originales en altura, corte de pelo y tono de piel.

Google recibió críticas en febrero cuando lanzó el convertidor de texto a imagen de Gemini, ya que creó imágenes históricamente incorrectas.

Whisk, un sitio web de Google Labs disponible solo en Estados Unidos, está en una etapa inicial de desarrollo, según afirmó la compañía.

OpenAI presentó Sora, un generador de texto a video, mostrando la competitividad de productos de consumo.

Dan Ives, director gerente y analista senior de acciones de Wedbush Securities, dijo a CNN que Whisk es otro “momento para lucir músculos” para Google en inteligencia artificial y tecnología.

Los productos de inteligencia artificial forman parte del “tesoro” de nuevos productos de Google para 2025, que incluye un nuevo sistema operativo Android desarrollado con Samsung y Qualcomm. “DeepMind es un activo clave para Google”, dijo Ives.

Maria Doe

Editora en KNfinan desde 2023.

December 18, 2024
9:01 am

DESCARGO DE RESPONSABILIDAD:

En ningún caso se le solicitará realizar un pago para acceder a cualquier tipo de producto, incluyendo tarjetas de crédito, préstamos u otras ofertas. Si esto ocurre, por favor contáctenos de inmediato. Siempre lea los términos y condiciones del proveedor de servicios al que está contactando. Obtenemos ingresos a través de la publicidad y referencias para algunos productos, pero no todos, mostrados en este sitio web. Todo lo publicado aquí se basa en investigaciones cuantitativas y cualitativas, y nuestro equipo se esfuerza por ser lo más justo posible en la comparación de opciones competidoras.

DIVULGACIÓN DEL ANUNCIANTE:

Somos un sitio editorial independiente, objetivo y financiado por publicidad. Para respaldar nuestra capacidad de proporcionar contenido gratuito a nuestros usuarios, las recomendaciones que aparecen en nuestro sitio pueden provenir de empresas de las que recibimos compensación como afiliados. Esta compensación puede afectar la manera, el lugar y el orden en que aparecen las ofertas en nuestro sitio. Otros factores, como nuestros propios algoritmos propietarios y los datos de primera parte, también pueden afectar la forma y el lugar donde se colocan los productos/ofertas. No incluimos en nuestro sitio web todas las ofertas financieras o de crédito actualmente disponibles en el mercado.

NOTA EDITORIAL:

Las opiniones expresadas aquí son únicamente las del autor y no representan a ningún banco, emisor de tarjetas de crédito, hotel, aerolínea u otra entidad. Este contenido no ha sido revisado, aprobado o respaldado por ninguna de las entidades mencionadas en el mensaje. Dicho esto, la compensación que recibimos de nuestros socios afiliados no influye en las recomendaciones o consejos que nuestro equipo de redactores proporciona en nuestros artículos, ni afecta de ninguna manera el contenido de este sitio web. Aunque trabajamos arduamente para proporcionar información precisa y actualizada que creemos que nuestros usuarios encontrarán relevante, no podemos garantizar que toda la información proporcionada sea completa y no hacemos ninguna declaración o garantía sobre su exactitud o aplicabilidad.