Minimax AI - Empresa de generación de vídeo de IA en China

IA Minimax

Presentación de la empresa Minimax AI

MiniMax AI está desarrollando tecnologías de modelado de IA a gran escala, creadores de infraestructuras y soluciones de aplicación de contenidos. MiniMax, la última incursión en la IA generativa de la startup unicornio respaldada por Alibaba y Tencent, se dedica al desarrollo de sistemas de motores de Inteligencia Artificial General (AGI), fue fundada en 2021 y tiene su sede en Shanghái (China). Uno de sus principales productos es un generador de texto a vídeo que ha causado sensación por su capacidad de generar imágenes hiperrealistas de seres humanos, incluidos movimientos precisos de las manos.

Productos Minimax AI

Generación de vídeo Modelo: video-01

Video-01 es Modelo de IA que puede generar vídeos de alta resolución a partir de instrucciones de texto, con una resolución de 1.280 x 720 píxeles a 25 fotogramas por segundo. Actualmente, los vídeos están limitados a seis segundos. Video-01 ofrece varios estilos, como anime, CGI y gráficos de videojuegos. El modelo muestra relativamente pocos errores o artefactos de imagen e incluso parece capaz de mostrar texto en los vídeos. MiniMax video-01 es un buen modelo, aproximadamente equivalente a Máquina de los sueños de Luma Labs pero no tan bueno como Runway Gen-3

Modelo Music Generation: Music-01

Music-01 es un modelo ai de conversión de texto en música:

  • Generación musical altamente antropomórfica: Este modelo elabora composiciones musicales intrincadas y emotivas, por lo que resulta ideal para diversos escenarios creativos y ofrece una gran flexibilidad e innovación en la creación musical.
  • Compatible con varios estilos: El modelo maneja con destreza una amplia gama de estilos musicales: desde instrumentos tradicionales hasta música electrónica moderna, y desde música clásica china hasta pop occidental.

Texto Modelo Grande: abab 6.5s

abab 7 admite el entrenamiento eficiente de vastos conjuntos de datos, lo que mejora significativamente la practicidad y la velocidad de respuesta, al tiempo que reduce drásticamente los costes de entrenamiento y razonamiento para modelos de gran tamaño. En comparación con la arquitectura Transformer tradicional, esta nueva arquitectura reduce los costes en más de 90% con una longitud de secuencia de 128K, con ventajas aún mayores a medida que aumenta la longitud de la secuencia.

Modelo grande de voz: speech-01

Variedad de tonos hiperantropomórficos de alta calidad, capacidades de generación de voz de última generación.

Compartir

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *