Presentación de la empresa Minimax AI
MiniMax AI está desarrollando tecnologías de modelado de IA a gran escala, creadores de infraestructuras y soluciones de aplicación de contenidos. MiniMax, la última incursión en la IA generativa de la startup unicornio respaldada por Alibaba y Tencent, se dedica al desarrollo de sistemas de motores de Inteligencia Artificial General (AGI), fue fundada en 2021 y tiene su sede en Shanghái (China). Uno de sus principales productos es un generador de texto a vídeo que ha causado sensación por su capacidad de generar imágenes hiperrealistas de seres humanos, incluidos movimientos precisos de las manos.
Productos Minimax AI
Generación de vídeo Modelo: video-01
Video-01 es Modelo de IA que puede generar vídeos de alta resolución a partir de instrucciones de texto, con una resolución de 1.280 x 720 píxeles a 25 fotogramas por segundo. Actualmente, los vídeos están limitados a seis segundos. Video-01 ofrece varios estilos, como anime, CGI y gráficos de videojuegos. El modelo muestra relativamente pocos errores o artefactos de imagen e incluso parece capaz de mostrar texto en los vídeos. MiniMax video-01 es un buen modelo, aproximadamente equivalente a Máquina de los sueños de Luma Labs pero no tan bueno como Runway Gen-3
Modelo Music Generation: Music-01
Music-01 es un modelo ai de conversión de texto en música:
- Generación musical altamente antropomórfica: Este modelo elabora composiciones musicales intrincadas y emotivas, por lo que resulta ideal para diversos escenarios creativos y ofrece una gran flexibilidad e innovación en la creación musical.
- Compatible con varios estilos: El modelo maneja con destreza una amplia gama de estilos musicales: desde instrumentos tradicionales hasta música electrónica moderna, y desde música clásica china hasta pop occidental.
Texto Modelo Grande: abab 6.5s
abab 7 admite el entrenamiento eficiente de vastos conjuntos de datos, lo que mejora significativamente la practicidad y la velocidad de respuesta, al tiempo que reduce drásticamente los costes de entrenamiento y razonamiento para modelos de gran tamaño. En comparación con la arquitectura Transformer tradicional, esta nueva arquitectura reduce los costes en más de 90% con una longitud de secuencia de 128K, con ventajas aún mayores a medida que aumenta la longitud de la secuencia.
Modelo grande de voz: speech-01
Variedad de tonos hiperantropomórficos de alta calidad, capacidades de generación de voz de última generación.