Microsoft dio un paso decisivo en el campo de la inteligencia artificial generativa con la presentación oficial de MAI-Image-1, su primer modelo propio para crear imágenes fotorrealistas sin costo. La herramienta ya está disponible dentro del creador de imágenes de Bing, accesible desde navegadores web y dispositivos móviles para cualquier usuario con una cuenta Microsoft.
El anuncio fue confirmado por Mustafa Suleyman, director de Microsoft AI y cofundador de DeepMind, a través de la red social X. Según explicó, el modelo destaca por su capacidad para producir escenas naturales, iluminación artística y representaciones visuales complejas, desde objetos cotidianos hasta alimentos o ambientes detallados.
Un modelo desarrollado completamente por Microsoft
A diferencia de estrategias anteriores, Microsoft entrenó MAI-Image-1 de forma interna, sin recurrir a modelos de terceros. Su entrenamiento se realizó con datos seleccionados y pruebas diseñadas para responder a las actuales necesidades creativas.
La compañía también involucró a profesionales del sector creativo para ajustar el desempeño del modelo, incorporando sugerencias en torno a composición, textura y manejo de luz. Como resultado, Bing describe a MAI-Image-1 como un sistema capaz de manejar altos niveles de detalle visual y texturas realistas.
Durante el lanzamiento, Suleyman compartió varias imágenes generadas por la IA, demostrando su calidad en distintos contextos visuales.
Cómo funciona MAI-Image-1
El sistema permite:
-
generar imágenes mediante descripciones textuales,
-
transformar o mejorar una imagen subida por el usuario,
-
trabajar en formatos 1:1, 3:2 y 2:3,
-
descargar resultados en resolución máxima de 1248 × 832 píxeles.
El modelo no admite aún la edición directa sobre imágenes generadas previamente; cada modificación del prompt produce una nueva imagen.
Aunque los expertos coinciden en que MAI-Image-1 aún no alcanza el nivel de plataformas como Midjourney, destacan su sólido rendimiento, especialmente cuando el usuario proporciona prompts con contexto fotográfico, iluminación o técnica.
Integración con Copilot y generación desde audio
Microsoft también anunció que el modelo ya funciona dentro de las expresiones de audio de Copilot, una característica experimental que crea imágenes basadas en el contenido emocional o narrativo de un archivo de sonido.
Por ejemplo, en el modo Historia, el sistema analiza un audio y genera una imagen que representa visualmente su tema principal.
Disponible para todos los usuarios
La herramienta ya está operativa para quienes posean una cuenta Microsoft, marcando un avance relevante en la expansión de herramientas de IA creativa al alcance del público general.
InformarEs Porque informar es nuestra misión