Hoy, Meta FAIR ha hecho un anuncio emocionante al compartir diversos nuevos artefactos de investigación que apoyan su Meta de alcanzar una inteligencia máquina avanzada (AMI), al tiempo que promueven la ciencia abierta y la reproducibilidad en sus desarrollos. Este esfuerzo reafirma su compromiso con la innovación tecnológica, beneficiando a la comunidad global.
Actualizaciones Clave Lanzadas
- Presentamos el Meta Segment Anything 2.1 (SAM 2.1), que es una actualización de nuestro popular modelo de Segmentación de Todo para imágenes y videos. Incluye un nuevo conjunto de herramientas para desarrolladores, con código para entrenar modelos y una demostración en la web.
- También compartimos avances significativos en la mejora de la eficiencia y la expansión de las capacidades de los grandes modelos de lenguaje (LLMs por sus siglas en inglés). Además, estamos lanzando artefactos de investigación para validar la seguridad de la criptografía post-cuántica, acelerar y reimaginar el entrenamiento de modelos y facilitar el descubrimiento de materiales inorgánicos.
- A través de estas acciones, Meta reafirma su convicción de que el acceso a tecnología avanzada en inteligencia artificial puede abrir puertas a oportunidades para todos. Por ello, se comprometen a fomentar el crecimiento de un ecosistema de IA abierto y accesible.
Compromiso con la Comunidad de IA
El equipo de Investigación de Inteligencia Artificial Fundamental (FAIR) de Meta se ha enfocado en utilizar la inteligencia avanzada para impulsar productos e innovaciones que beneficien el bienestar de la humanidad. Desde hace más de una década, Meta ha compartido investigaciones de vanguardia y ha colaborado con la comunidad global de IA. La misión de alcanzar AMI se presenta como una extensión de este compromiso por innovar para el bien común.
La reciente actualización del modelo SAM 2.1 ha recibido más de 700,000 descargas en las 11 semanas desde su lanzamiento. Este modelo ya se está utilizando significativamente en disciplinas como la investigación médica y meteorológica, mostrando su impacto positivo en la comunidad científica.
Mejoras en el Meta Segment Anything Model 2.1
El SAM 2.1 proporciona un rendimiento mejorado, gracias a nuevas técnicas de aumento de datos que simulan la presencia de objetos visualmente similares y mejora en el manejo de oclusiones al entrenar el modelo con secuencias de imágenes más largas. Además, estamos compartiendo el Conjunto de Desarrollo de SAM 2, que incluye código abierto para facilitar su implementación por la comunidad.
Innovaciones en Modelos de Lenguaje
Una de las nuevas incorporaciones a nuestro repertorio es Meta Spirit LM, un modelo de lenguaje multimodal que integra texto y voz. Este modelo busca resolver las limitaciones actuales en los procesos de generación de voz y transcripción automática, permitiendo a los usuarios crear voces más expresivas y naturales.
A través de un enfoque innovador, Meta Spirit LM permite el aprendizaje de nuevas tareas a través de diferentes modalidades, como el reconocimiento automático del habla y la síntesis del habla. Pronto estarán disponibles [la investigación de este modelo] y el código de su implementación [en GitHub].
Capacidades Mejoradas para Modelos de Lenguaje Grande
Otro desarrollo importante en nuestro catálogo es Layer Skip, una solución diseñada para acelerar los tiempos de generación de los LLMs. Layer Skip optimiza la precipitación en capas del modelo, mejorando notablemente el rendimiento y posibilitando una generación de resultados hasta 1.7 veces más rápida.
La implementación de Layer Skip es ahora accesible, incluyendo versiones optimizadas de modelos populares, que facilitarán aún más el avance en este campo. [Lee más acerca de esta innovación aquí] y encuentra el código para implementarla [aquí].
Avances en Criptografía Post-Cuántica
La investigación en criptografía, fundamental para la seguridad de la información, debe mantenerse a la vanguardia para proteger los datos personales. Hoy, compartimos nuevas herramientas y códigos que habilitan la evaluación y comparación de ataques basados en inteligencia artificial.
Nuestra investigación en la técnica Salsa permite realizar ataques sobre la criptografía basada en redes, contribuyendo a la comprensión de potenciales vulnerabilidades en la criptografía que pueden ser explotadas por modelos de IA y fortaleciendo así la seguridad futura de sistemas criptográficos.
Descubrimiento de Materiales y Eficiencia en Entrenamiento de Modelos
Meta Lingua es una nueva plataforma lanzada para facilitar el entrenamiento eficiente y a gran escala de modelos de lenguaje. Al enfocarse en la simplicidad y reutilización, esta herramienta permitirá a los investigadores acelerar su trabajo y llevar sus ideas a la práctica con menor esfuerzo técnico.
Finalmente, lanzamos el conjunto de datos Meta Open Materials 2024, un recurso para el descubrimiento acelerado de materiales inorgánicos a través de investigación abierta. Con más de 100 millones de ejemplos de entrenamiento, este proporciona una opción competitiva para la comunidad de investigación en materiales y IA, asegurando así avances significativos en el descubrimiento de nuevos materiales.
Conclusión
La revelación de estos modelos, códigos y conjuntos de datos representa solo una parte de nuestro viaje hacia el cumplimiento de metas más amplias en tecnología de IA. Esperamos que la comunidad de IA aproveche estas innovaciones para avanzar en sus propios proyectos. Desde Meta, estamos comprometidos con la creación de una IA inclusiva y accesible, que beneficie a todos.