Lectura de Tesis de Javier Morlana Ledesma.

El viernes 20 de junio a las 9:00 en el Seminario del Departamento, en el edificio Ada Byron tendrá lugar la defensa de la tesis de Javier Morlana Ledesma, "Place Recognition and Topological SLAM for Endoscopy", dirigida por el Doctor D. José María Martínez Montiel.

 

Resumen

 

Las técnicas de Localización y Mapeo Simultáneo Visual (SLAM) son un pilar fundamental en numerosas aplicaciones industriales y de consumo, como la Realidad Aumentada (AR) y la Robótica, debido a su capacidad para generar mapas precisos y realizar localización utilizando únicamente una cámara. Aunque estas técnicas están bien establecidas para entornos fuera del cuerpo, su aplicación en endoscopia sigue siendo un desafío debido a factores como las deformaciones de los tejidos, las oclusiones frecuentes y los cambios drásticos en la iluminación.

 

Esta tesis se centra en llevar las técnicas de Localización y Mapeo Visual basadas exclusivamente en cámaras monoculares al ámbito de la endoscopia, particularmente para colonoscopias. En lugar de los mapas métricos 3D convencionales, proponemos una formulación topológica en la que el mapa se representa como un grafo, donde los nodos corresponden a diferentes ubicaciones anatómicas y los arcos indican conexiones navegables. Un componente clave de un sistema robusto de SLAM topológico es el Reconocimiento Visual de Lugares (VPR), es decir, la capacidad de determinar si dos imágenes provienen de la misma ubicación. Las contribuciones de esta tesis se alinean con estos dos campos fundamentales: el Reconocimiento Visual de Lugares y el SLAM topológico.

 

En la primera parte de la tesis, exploramos el Reconocimiento Visual de Lugares. Analizamos técnicas clásicas de VPR basadas en Bag-of-Words e integramos estos métodos en SD-DefSLAM, un SLAM métrico deformable robusto capaz de procesar secuencias reales de laparoscopia. A continuación, proponemos DRAN, un algoritmo basado en aprendizaje profundo que unifica todas las tareas clave de Localización Visual dentro utilizando una única red: Reconocimiento Visual de Lugares, reordenamiento de candidatos y estimación inicial de la pose, así como refinamiento de la pose de la cámara.

 

En la segunda parte, presentamos dos algoritmos nuevos de Localización y Mapeo topológico. Aprovechando técnicas de VPR basadas en aprendizaje profundo y 'priors' específicos del dominio de la colonoscopia, nuestros sistemas pueden construir una representación topológica de todo el colon y localizarse dentro de él. En primer lugar, presentamos ColonMapper, el primer algoritmo de Localización y Mapeo topológico para colonoscopia, que agrupa imágenes covisibles en nodos para formar un mapa topológico. En segundo lugar, como nuestra contribución final, introducimos ColonSLAM, el primer SLAM métrico-topológico para colonoscopias, un enfoque híbrido que combina submapas métricos con un grafo topológico para generar representaciones ricas del procedimiento. Nuestros métodos permiten la localización entre diferentes secuencias de un mismo paciente, abriendo la puerta a nuevas aplicaciones médicas como la asistencia a la navegación y el seguimiento automático de enfermedades.

 

Enlaces:

https://jmorlana.github.io/