Microsoft anunció dos nuevos modelos de IA capaces de competir con OpenAI, Google y otras empresas. Tras meses de rumores y especulaciones, el gigante tecnológico presentó los primeros frutos de su división de inteligencia artificial comandada por el cofundador de DeepMind, Mustafá Sulaymán. Los modelos apuntan a diversos segmentos y uno de ellos se desarrolló bajo el mismo proceso que utilizan DeepSeek y otros modelos chinos.
De acuerdo con una publicación en su web de IA, Microsoft presentó MAI-Voice-1 y MAI-1-preview. El primero de ellos es un modelo de generación de voz “altamente expresivo y natural” capaz de generar un minuto de audio en menos de 1 segundo. Según la empresa, la IA está optimizada para funcionar en una sola GPU y es altamente eficiente, por lo que ya se integró en los resúmenes de noticias de Copilot Daily y Podcasts.
MAI-Voice-1 ofrece audio de alta fidelidad con entonación natural y expresiva. Microsoft señala que esta IA puede utilizarse para narrar historias o generar meditaciones guiadas, así como también para desarrollar un asistente virtual con conversación en tiempo real.
Para mostrar su funcionamiento, los de Redmond lanzaron “Expresiones de audio de Copilot” dentro de Copilot Labs. Esta herramienta es capaz de generar audio a través de un guion y permite que los usuarios modifiquen los estilos de narración. La nueva función ofrece un Modo emotivo, en el cual se puede ajustar el tono, ritmo del narrador o asignar una voz distinta, así como también el Modo historia con narración expresiva.

MAI-1-preview, la IA de Microsoft que reducirá la dependencia de OpenAI
Mientras que MAI-Voice-1 está enfocado en la velocidad de inferencia, su hermano mayor fue desarrollado para competir con otras IA robustas. MAI-1-preview es el primer modelo basado en texto de Microsoft que se utilizará para impulsar las próximas versiones de Copilot. La compañía señaló que MAI-1-preview se entrenó con aproximadamente 15.000 GPU NVIDIA H-100 utilizando la arquitectura Mixture-of-Experts (MoE).
Si sientes una especie de déjà vu al escuchar este término, no eres el único. La “Mezcla de Expertos” es un nuevo enfoque de aprendizaje automático que se utiliza en modelos como DeepSeek o Qwen3. La arquitectura divide el modelo en componentes especializados (expertos) y activa solo las partes necesarias para una tarea específica, lo que permite optimizar recursos.
En una entrevista con Semafor, Mustafá Sulaymán dijo que aprovecharon técnicas de la comunidad de código abierto para mejorar los modelos con recursos mínimos. “MAI-1-preview está diseñado para proporcionar capacidades poderosas a los consumidores que buscan beneficiarse de modelos que se especializan en seguir instrucciones y proporcionar respuestas útiles a las consultas diarias”, mencionó.
El nuevo modelo no reemplazará a GPT-5 en Copilot. Microsoft dijo que integrará MAI-1-preview en las próximas semanas y lo usará para ejecutar tareas específicas. La compañía medirá el rendimiento y usará los comentarios de los usuarios para mejorar su IA en la próxima versión. El modelo también estará disponible en LMArena y a través de una API para desarrolladores.
Aunque uno de sus modelos está diseñado para ser expresivo y natural, el jefe de Microsoft AI dejó claro que eliminarán cualquier cualidad que haga parecer a la IA como si tuviera sentimientos y objetivos. Hace unos días, Mustafá Sulaymán publicó un artículo sobre los peligros de construir sistemas que parezcan personas.
“Hace unos años, hablar de IA consciente habría parecido una locura. Hoy en día, se percibe como algo cada vez más urgente”, dijo. “Debemos construir una IA para las personas; no hacerla una persona digital”.