Meta lanza Meta Segmentation Model (MSM) una herramienta de inteligencia artificial que puede segmentar cualquier imagen
Meta, la empresa matriz de Facebook, ha lanzado una nueva herramienta de inteligencia artificial llamada Meta Segmentation Model (MSM), que puede segmentar cualquier tipo de imagen o vídeo en diferentes partes o regiones. La segmentación es un proceso que consiste en dividir una imagen o un vídeo en áreas homogéneas según algún criterio, como el color, la forma o el contenido semántico. Por ejemplo, se puede segmentar una imagen de una calle en coches, peatones, edificios, árboles, etc.
Para que se usa la segmentación
La segmentación tiene muchas aplicaciones prácticas en campos como la medicina, la seguridad, la educación o el entretenimiento. Por ejemplo, se puede usar para detectar tumores en imágenes médicas, para reconocer objetos o personas en vídeos de vigilancia, para crear efectos especiales en películas o juegos, o para generar escenarios virtuales para la realidad aumentada o el metaverso.
Sin embargo, la segmentación no es una tarea fácil para la inteligencia artificial, ya que requiere un gran poder de cómputo y una gran cantidad de datos etiquetados. Los datos etiquetados son aquellos que tienen información adicional sobre lo que hay en cada píxel o región de la imagen o el vídeo. Por ejemplo, si queremos segmentar una imagen de un gato, necesitamos saber qué píxeles corresponden al gato y cuáles al fondo. Etiquetar manualmente los datos es un proceso costoso y tedioso que limita el avance de la investigación y el desarrollo en este campo.
Meta Segmentation Model la apuesta de Meta
Para superar este problema, Meta ha creado Meta Segmentation Model (MSM), una herramienta que puede segmentar cualquier cosa sin necesidad de datos etiquetados específicos. MSM se basa en un tipo de inteligencia artificial llamado aprendizaje auto-supervisado, que consiste en aprender a partir de los propios datos sin intervención humana. En este caso, MSM aprende a segmentar a partir de imágenes y vídeos sin etiquetas que se encuentran en internet.
MSM funciona mediante dos pasos: primero, extrae características visuales de las imágenes y los vídeos usando una red neuronal profunda; y segundo, agrupa las características similares usando un algoritmo de agrupamiento espectral. De esta forma, MSM puede identificar las diferentes partes o regiones de una imagen o un vídeo sin saber qué son ni cómo se llaman.
Según Meta, Meta Segmentation Model (MSM) puede segmentar cualquier cosa con una precisión comparable o superior a la de otras herramientas basadas en datos etiquetados específicos. Además, MSM puede adaptarse fácilmente a diferentes dominios o tareas simplemente cambiando el conjunto de datos de entrada. Por ejemplo, se puede usar MSM para segmentar imágenes médicas usando imágenes médicas sin etiquetas como entrada.
Meta Segmentation Model (MSM) pensado para el metaverso
Meta ha publicado el código fuente y los modelos pre-entrenados de Meta Segmentation Model (MSM) en su plataforma AI Hub , donde los investigadores y desarrolladores pueden acceder a ellos y usarlos para sus propios proyectos. Meta espera que MSM impulse la innovación y la creatividad en el campo de la segmentación y contribuya a crear experiencias más inmersivas e interactivas para el metaverso.