Si bien, ya sabemos de la irrupción de la empresa china DeepSeek, que les había movido el tapete a las empresas tecnológicas estadounidenses lideres en inteligencia artificial, al lanzar su propia inteligencia artificial pero demostrando ser eficiente en resultados y en costes de desarrollo al ser de código abierto. Pero que sí, carecía de un modelo para la gestión de las imágenes.

Pues bien, ya anunciaron su nuevo modelo Janus Pro 7B, una inteligencia artificial multimodal, una contribución muy prometedora en el campo de inteligencia artificial en este 2025.

Cómo funciona Janus Pro 7B

Como modelo multimodal, no solo genera imágenes a partir de texto, sino que también analiza y comprende las imágenes que cargamos, algo que lo distingue en el sector de los modelos multimodales porque suelen priorizar una u otra capacidad.

Janus Pro 7B representa un cambio de paradigma, integrando capacidades avanzadas de lenguaje y visión en una arquitectura compacta de 7 mil millones de parámetros.

Esta innovación la hereda del modelo base de lenguaje de DeepSeek, mientras introduce un sistema de submuestreo para mantener la eficiencia de imágenes.

El modelo introduce una arquitectura de doble vía, que separa los procesos de codificación, facilitando la comprensión y generación de imágenes, pero todo dentro  un único "transformer". Este diseño mejora tanto la eficiencia como el rendimiento, un aspecto crítico en aplicaciones donde la velocidad y la precisión son esenciales.

Janus Pro 7B es de Código Libre

Janus Pro 7B sigue el enfoque del código abierto, pero con restricciones éticas. Su repositorio está disponible bajo la licencia MIT, lo que permite a los desarrolladores a modificar y distribuir el código libremente, incluso con fines comerciales.

Sin embargo, el modelo como tal opera bajo la licencia de DeepSeek, que prohíbe explícitamente su uso en actividades militares o generación de desinformación.