Tecnología y sociedad
Llega la revolución de la voz: Maya, el asistente que no sabes si es humano o IA
Con capacidad para expresar emociones, el nuevo asistente de Sesame AI mantiene conversaciones como cualquier persona

Recreación artísitca del asistente de voz Maya, desarrollado por Sesame AI. / DALL·E 2025/T21
¿Estás hablando con una persona o con un programa informático? Con Maya, el revolucionario asistente de voz de Sesame AI lanzado a finales de febrero, la línea que separa la comunicación humana de la artificial se ha vuelto casi imperceptible. Mantiene conversaciones tan genuinas que redefine nuestras expectativas sobre los asistentes virtuales.
Maya, el nuevo asistente de voz desarrollado por Sesame AI, está redefiniendo la interacción entre humanos e inteligencia artificial con su extraordinaria capacidad para mantener conversaciones naturales que trascienden las limitaciones de los asistentes tradicionales.
Lanzado a finales de febrero de 2025, Maya representa un salto significativo en la síntesis de voz, utilizando tecnología de vanguardia para crear interacciones tan genuinas que muchos usuarios las describen como "inquietantemente humanas". Si bien actualmente Maya comprende español pero no puede responder en este idioma, su notable inteligencia contextual, capacidad para expresar emociones y adaptarse a distintos usuarios la posiciona como una innovación disruptiva en el panorama tecnológico actual.
Este asistente de voz forma parte de una estrategia más amplia de Sesame para desarrollar lo que denominan "presencia de voz", un concepto que define la "cualidad mágica que hace que las interacciones habladas se sientan reales, comprendidas y valoradas".
A diferencia de otros lanzamientos tecnológicos recientes, Sesame ha anunciado que planea hacer que sus modelos estén disponibles bajo una licencia Apache-2.0, lo que permitirá a desarrolladores de todo el mundo construir sobre esta tecnología innovadora.
Más allá del mecanicismo
El desarrollo de Maya responde a una necesidad identificada por Sesame: superar las limitaciones de los asistentes de voz actuales, que, a pesar de su utilidad, siguen ofreciendo experiencias mecánicas que evidencian la interacción con una máquina.
Según la información publicada por Turtles AI, el sistema de Maya está basado en tecnologías transformer que integran tokens semánticos y acústicos para reproducir fielmente la complejidad de la prosodia humana. Esta arquitectura multimodal permite analizar tanto la cronología como el contexto de las conversaciones, habilitando diálogos fluidos y expresivos que satisfacen las necesidades de aplicaciones digitales y sistemas interactivos contemporáneos.
El entrenamiento de Maya se ha realizado con un corpus masivo de más de un millón de horas de audio predominantemente en inglés, lo que establece una base sólida para expansiones futuras a medios multilingües. Este enfoque integral ha permitido a Sesame AI superar uno de los mayores desafíos técnicos en la generación de voz: el problema "uno-a-muchos", mediante el uso de inteligencia contextual para modular tono, ritmo y expresividad.
Más emocional
Su tecnología va mucho más allá de los sistemas tradicionales de texto a voz, incorporando modelos de aprendizaje profundo que analizan tono, contexto y emoción, asegurando una experiencia de usuario fluida y realista. Este asistente demuestra una sorprendente conciencia contextual, recordando conversaciones pasadas para proporcionar respuestas relevantes y manteniendo el hilo narrativo a lo largo de múltiples intercambios.
La inteligencia emocional representa otro avance significativo en el diseño de Maya. El sistema puede detectar emociones en la entrada de voz del usuario y responder apropiadamente, adaptando su tono y estilo según el estado emocional percibido del interlocutor. Demuestra empatía e incluso puede ajustar sus respuestas para desescalar frustración o adaptar su tono al ambiente de la conversación.
Tiempo real
El procesamiento en tiempo real es fundamental para la experiencia que ofrece Maya. El asistente entrega respuestas con un retraso mínimo, garantizando interacciones fluidas y sin interrupciones que mantienen el ritmo natural de una conversación humana. Esta capacidad técnica permite que los diálogos con Maya fluyan de manera orgánica, eliminando las pausas artificiales que suelen delatar a otros asistentes de voz.
Quizás lo más impresionante de Maya es su habla realista, reconocida unánimemente, que incorpora pausas naturales, risas y respiraciones que crean una sensación verdaderamente humana. Estas sutiles características sonoras, a menudo ausentes en otros asistentes, contribuyen significativamente a la sensación de estar conversando con una persona real. Durante pruebas documentadas, algunos usuarios han quedado tan impresionados por el realismo que han olvidado momentáneamente que estaban hablando con una inteligencia artificial, como destaca ZDnet.
Implicaciones futuras
El lanzamiento de Maya representa mucho más que la introducción de un nuevo asistente de voz; marca un punto de inflexión en nuestra comprensión de lo que la interacción humano-máquina puede llegar a ser. Mientras Sesame ha anunciado que planea hacer disponibles sus modelos bajo licencia Apache-2.07, esta apertura podría catalizar una nueva ola de innovación en aplicaciones de voz, permitiendo a desarrolladores de todo el mundo construir sobre esta tecnología revolucionaria.
Y un detalle significativo: la Administración del Seguro Social de Estados Unidos recientemente anunció una reducción significativa de su fuerza laboral, citando entre sus razones la inversión en "automatización impulsada por IA" para manejar reclamaciones y consultas con mayor eficiencia. Este tipo de decisiones organizacionales subraya cómo tecnologías como Maya podrían transformar sectores enteros, particularmente aquellos con fuerte componente de servicio al cliente o soporte telefónico.
- El puente romano de Talavera de la Reina no era romano y ya se derrumbó en al menos 8 ocasiones
- Terelu cruza el puente de las emociones en 'Supervivientes' tras activar el protocolo de abandono
- Jordi Évole desaparece de laSexta tras pedir acudir de invitado a 'La revuelta
- ¿Qué es un dolicomegacolon, a quién le puede afectar, qué síntomas tiene y cómo se cura?
- El catedrático José Antonio Marina explica por qué perdemos tiempo buscando la felicidad: 'Está bien para un anuncio de Coca-Cola, pero no para un proyecto vital
- La doctora Nuria Roure explica en qué momento irse a dormir: 'Marca la diferencia entre tu descanso y bienestar
- Hatim Azahri: 'Mi fortuna fue encontrarme con maestras que se fijaron en mi potencial, no en mi origen
- Un nuevo famoso se suma al veto de Mario Vaquerizo en 'La Revuelta': 'No me quieren ni ver