El nuevo método utiliza el aprendizaje automático para extrapolar características de imágenes térmicas.
No es tarea fácil para una computadora identificar la cara de un individuo a la luz del día. El proceso implica la medición precisa de determinados rasgos: tamaño del ojo, distancia de la nariz a la boca, etc., ajustando las distancias a las tres dimensiones y buscando coincidencias en una base de datos. Pero para hacerlo de noche, cuando de lo único que se dispone es de imágenes térmicas de baja resolución, el Laboratorio de Investigación del Ejército utilizó una técnica que permite que el software imite al cerebro humano.
Nuestros cerebros «ven», extrapolando una imagen a partir de una cantidad relativamente pequeña de datos sensoriales filtrados a través del ojo. El cerebro utiliza varias veces más masa neuronal para construir imágenes a partir de datos visuales que el ojo para recopilarlos.
Los investigadores del Ejército vieron un paralelo en las imágenes térmicas. Estas muestran qué partes de la cara son más calientes y frías, pero generalmente contienen menos puntos de datos que una imagen óptica similar de una cámara, lo que dificulta la selección de características distintivas. Así que establecieron una «convolutional neural network» (CNN), un método de aprendizaje profundo que utiliza nodos específicos similares a los del cerebro, y lo configuraron para inferir caras a partir de datos limitados.
El método que utilizan los investigadores descompone la imagen térmica de una cara en regiones específicas y luego las compara con una imagen óptica de la misma cara. La red estima dónde se encuentran las características clave en la imagen térmica en relación con la imagen convencional. El producto final de la red es algo así, como un boceto de los elaborados por la policía, no una coincidencia perfecta, pero ofrece suficiente superposición en los puntos clave para hacer una coincidencia de alta precisión.
En un artículo publicado por la IEEE Winter Conference on Applications of Computer Vision, los investigadores escriben: «Pudimos producir representaciones altamente discriminatorias. A pesar de que las imágenes sintetizadas no producen una textura foto-realista, el rendimiento de la verificación lograda fue mejor que la línea de base y que los enfoques recientes al comparar las caras sintetizadas con la cara visible».
Este mes, el Laboratorio publicó una declaración citando al investigador Benjamin S. Riggan, quien dijo: «Cuando se utilizan cámaras térmicas para capturar imágenes faciales, el principal desafío es que la imagen térmica capturada debe compararse con una librería o galería, que sólo contiene imágenes visibles convencionales de personas de interés… Por lo tanto, el problema se convierte en lo que se denomina reconocimiento facial de espectro cruzado, o heterogéneo. En este caso, las imágenes faciales adquiridas con una modalidad se comparan con la base de datos de una librería adquirida mediante una modalidad de imágenes diferente».
Fte. Defense One