Microsoft lanzó MAI-Image-1 para crear fotos realistas con IA: le llegó competencia a ChatGPT Y Gemini

Guardar

Microsoft presenta MAI-Image-1, el modelo propio que impulsa una nueva era en la generación de imágenes realistas

En el competitivo mercado de la inteligencia artificial generativa, Microsoft irrumpió con una novedad relevante. La compañía presentó MAI-Image-1, su primer modelo propio para la creación de imágenes realistas, disponible en dos de sus plataformas: Bing Image Creator y Copilot Audio Expressions.

El lanzamiento, producido en octubre del presente año, marca una transición clave para Microsoft en su objetivo de reducir la dependencia de tecnologías ajenas y competir de manera directa con actores como OpenAI y Google.

Mustafa Suleyman, jefe de IA de Microsoft, comunicó a través de X que el nuevo modelo busca destacar por su rapidez y calidad en la generación de imágenes a partir de texto. Aunque la herramienta ya está disponible en diversos mercados, se espera su pronta llegada a la Unión Europea, donde todavía no fue habilitada.

MAI-Image-1: la clave de Microsoft para crear imágenes realistas más rápido y con alto nivel de detalle - MICROSOFT

De acuerdo con Suleyman, el modelo sobresale en la creación de imágenes de alimentos, paisajes naturales, representaciones con iluminación artística y alto nivel de fotorrealismo.

El desarrollo de MAI-Image-1 responde a la estrategia de Microsoft de fortalecer su ecosistema de inteligencia artificial con soluciones propias. “MAI-Image-1 sobresale en la generación de imágenes fotorrealistas, como iluminación (por ejemplo, luz reflejada, reflejos), paisajes y mucho más. Esto es especialmente cierto en comparación con muchos modelos más grandes y lentos”, fue publicado en el blog oficial de la compañía.

Desde la perspectiva de Microsoft, la eficiencia del modelo permite a los usuarios crear imágenes en menos tiempo, experimentar con iteraciones y trasladar rápidamente los resultados a otras herramientas de diseño.

Además de alimentar Bing Image Creator, MAI-Image-1 acompaña también el denominado “modo historia” de la función de texto a voz de Copilot, llamada Copilot Audio Expressions. Esta integración posibilita que las narraciones generadas por inteligencia artificial incluyan arte visual, logrando una experiencia narrativa multimedia.

Este movimiento de Microsoft es una apuesta por tener autonomía en las tecnologías de sistemas generativos - REUTERS/Dado Ruvic/Illustration/File Photo

El modelo constituye un elemento central en la apuesta estratégica de Microsoft para posicionar su asistente IA, Copilot, como una plataforma versátil que fusiona texto e imagen.

Microsoft lanzó recientemente otros modelos desarrollados internamente, como MAI-Voice-1, dedicado a síntesis de voz, y MAI-1-preview, un modelo de texto planeado para integrarse de manera parcial en Copilot. Según lo indicó la empresa, estas novedades evidencian el crecimiento de su capacidad tecnológica interna. Aún así, Microsoft mantiene acuerdos con otras compañías y ofrece a sus usuarios, dentro de Copilot, opciones como el modelo Claude de Anthropic y las últimas versiones de GPT de OpenAI.

En el creador de imágenes de Bing, MAI-Image-1 aparece como uno de los tres modelos disponibles, junto con DALL-E 3 y GPT-4o, ambos desarrollados por OpenAI.

Esta coexistencia ilustra el punto de transición, con Microsoft diversificando su oferta para ajustarse al ritmo acelerado de la competencia, mientras facilita a los usuarios una selección más amplia de herramientas de generación visual.

Nano Banana de Gemini y DALL E de ChatGPT son los modelos de generación de imágenes más utilizados en la actualidad

La competencia por la hegemonía en la inteligencia artificial generativa se intensifica con el avance de otros gigantes tecnológicos. Google ofrece capacidades similares a través de Gemini, su plataforma de IA conversacional, que integra el modelo propio Imagen (en su versión más reciente, Imagen 2), y Gemini 2.5 Flash Image, una opción que optimiza la generación y edición rápida.

Los usuarios pueden acceder a esta funcionalidad directamente desde la aplicación de Gemini, pidiendo la creación o edición de imágenes en lenguaje natural.

El modelo ‘Nano Banana’ se distingue por su potencia en la edición y expansión del lienzo (outpainting), además de la generación de imágenes desde cero. Al igual que las soluciones de Microsoft y OpenAI, Google concentra su desarrollo en interfaces de usuario conversacionales donde las tareas de generación visual están profundamente integradas con el procesamiento del lenguaje natural.

En el caso de OpenAI, el generador de imágenes es DALL-E, actualmente en su versión DALL-E 3. Este sistema se implementa tanto en la versión Plus de ChatGPT como mediante acceso a la API para desarrolladores. DALL-E 3 destaca por la integración nativa con modelos de lenguaje como GPT-4o, lo que amplía la capacidad de interpretar y responder con precisión a instrucciones y descripciones complejas, optimizando los resultados visuales sin intervención manual extensa.

Microsoft mantiene su asociación estratégica con OpenAI, pero el desarrollo autónomo de modelos como MAI-Image-1 refleja una tendencia clara hacia la autonomía tecnológica.

Microsoft MAI-Image-1 Generador de imágenes IA Gemini ChatGPT Lo último en tecnología

Últimas Noticias

El botón del TV que pocos conocen y que permite tener la mejor imagen en películas

Las últimas generaciones de Smart TV integran funciones como el Modo Cine y sensores de luz ambiental para ofrecer imágenes naturales adaptadas al entorno doméstico, revolucionando la experiencia televisiva tradicional

Top 5 de las profesiones que tendrán mejor trabajo en 2026 gracias a la IA

La incorporación de sistemas inteligentes en infraestructura crítica impulsará la creación de nuevos perfiles técnicos altamente especializados

Creador de ChatGPT se confesó y cree que “la IA va a tener efectos negativos en la salud mental”

Sam Altman, advirtió sobre los riesgos psicológicos, la posible dependencia de asistentes inteligentes y la urgencia de establecer marcos legales para proteger el bienestar y la privacidad de los usuarios

Microsoft lanzó MAI-Image-1 para crear fotos realistas con IA: le llegó competencia a ChatGPT Y Gemini

Integrado en Bing Image Creator y Copilot Audio Expressions, el nuevo modelo propio de Microsoft busca destacar por velocidad y calidad

Cómo será el modelo generador de imágenes de Microsoft

Gemini y ChatGPT, las competencias de Microsoft

Últimas Noticias

El botón del TV que pocos conocen y que permite tener la mejor imagen en películas

Las últimas generaciones de Smart TV integran funciones como el Modo Cine y sensores de luz ambiental para ofrecer imágenes naturales adaptadas al entorno doméstico, revolucionando la experiencia televisiva tradicional

Top 5 de las profesiones que tendrán mejor trabajo en 2026 gracias a la IA

La incorporación de sistemas inteligentes en infraestructura crítica impulsará la creación de nuevos perfiles técnicos altamente especializados

Creador de ChatGPT se confesó y cree que “la IA va a tener efectos negativos en la salud mental”

Sam Altman, advirtió sobre los riesgos psicológicos, la posible dependencia de asistentes inteligentes y la urgencia de establecer marcos legales para proteger el bienestar y la privacidad de los usuarios

Guía definitiva de computación cuántica: conceptos básicos y su impacto futuro

Esta tecnología funciona con cúbits, que permiten procesar datos en superposición y revolucionan el procesamiento informático

Qué significa USB y por qué se dice que llegó el final de su uso en el mundo

La evolución hacia USB-C y la nube está cambiando la forma en que los usuarios comparten, guardan y transfieren archivos en el día a día

El Gobierno porteño defendió el bloque de un conocido videojuego: “El mundo digital es una pileta y hay que ponerle un cerco”

La gripe y el COVID-19 pueden triplicar el riesgo de sufrir un infarto

Receta de milanesas sin pan rallado, rápida, fácil y saludable

Caso Cecilia Strzyzowski: se entregó el ex abogado de Emerenciano Sena buscado por amenazar a un perito

Un estudio confirmó que la amistad protege el cerebro y una vida social activa fortalece la memoria

Emmanuel Carrère obtuvo el Premio Médicis por una novela inspirada en la vida de su madre

Helen Garner ganó el Premio Baillie Gifford por sus diarios

EN VIVO: se inicia el American Business Forum con la presencia de Trump, Milei, Machado y otras figuras internacionales

El plan de Montevideo para recuperar su casco histórico y convertirlo en un lugar valioso para el turismo

Subastarán la casa del narco mexicano Gerardo González Valencia en Punta del Este: la base es un tercio del precio que pago él

Ailén Cova llevó a su hija Alaia por primera vez a la cancha a ver a Alexis Mac Allister: “El amuleto”

El reproche de Emilia Attias a Luis Ventura en MasterChef Celebrity: “Me hago responsable”

La sorprendente confesión de Marcos Giles a Ángela Torres que terminó con un beso en vivo

La inesperada declaración de Chino Leunis a Damián Betular que descolocó al cocinero al aire de Masterchef

La emotiva reflexión de José María Listorti junto a Mario Pergolini: “No sé si todos tienen esa fortuna”

Cómo será el modelo generador de imágenes de Microsoft

Gemini y ChatGPT, las competencias de Microsoft

Temas Relacionados

Últimas Noticias

El botón del TV que pocos conocen y que permite tener la mejor imagen en películas

Las últimas generaciones de Smart TV integran funciones como el Modo Cine y sensores de luz ambiental para ofrecer imágenes naturales adaptadas al entorno doméstico, revolucionando la experiencia televisiva tradicional

Top 5 de las profesiones que tendrán mejor trabajo en 2026 gracias a la IA

La incorporación de sistemas inteligentes en infraestructura crítica impulsará la creación de nuevos perfiles técnicos altamente especializados

Creador de ChatGPT se confesó y cree que “la IA va a tener efectos negativos en la salud mental”

Sam Altman, advirtió sobre los riesgos psicológicos, la posible dependencia de asistentes inteligentes y la urgencia de establecer marcos legales para proteger el bienestar y la privacidad de los usuarios

Guía definitiva de computación cuántica: conceptos básicos y su impacto futuro

Esta tecnología funciona con cúbits, que permiten procesar datos en superposición y revolucionan el procesamiento informático

Qué significa USB y por qué se dice que llegó el final de su uso en el mundo

La evolución hacia USB-C y la nube está cambiando la forma en que los usuarios comparten, guardan y transfieren archivos en el día a día

El Gobierno porteño defendió el bloque de un conocido videojuego: “El mundo digital es una pileta y hay que ponerle un cerco”

La gripe y el COVID-19 pueden triplicar el riesgo de sufrir un infarto

Receta de milanesas sin pan rallado, rápida, fácil y saludable

Caso Cecilia Strzyzowski: se entregó el ex abogado de Emerenciano Sena buscado por amenazar a un perito

Un estudio confirmó que la amistad protege el cerebro y una vida social activa fortalece la memoria

Emmanuel Carrère obtuvo el Premio Médicis por una novela inspirada en la vida de su madre

Helen Garner ganó el Premio Baillie Gifford por sus diarios

EN VIVO: se inicia el American Business Forum con la presencia de Trump, Milei, Machado y otras figuras internacionales

El plan de Montevideo para recuperar su casco histórico y convertirlo en un lugar valioso para el turismo

Subastarán la casa del narco mexicano Gerardo González Valencia en Punta del Este: la base es un tercio del precio que pago él

Ailén Cova llevó a su hija Alaia por primera vez a la cancha a ver a Alexis Mac Allister: “El amuleto”

El reproche de Emilia Attias a Luis Ventura en MasterChef Celebrity: “Me hago responsable”

La sorprendente confesión de Marcos Giles a Ángela Torres que terminó con un beso en vivo

La inesperada declaración de Chino Leunis a Damián Betular que descolocó al cocinero al aire de Masterchef

La emotiva reflexión de José María Listorti junto a Mario Pergolini: “No sé si todos tienen esa fortuna”