Investigadores Extraen Sonidos de Imágenes Fijas en Cámaras de Smartphone


Un grupo de investigadores académicos ideó una técnica para extraer sonidos de imágenes fijas capturadas utilizando cámaras de smartphone con obturadores rodantes y estructuras de lentes móviles.

Un grupo de investigadores académicos ha ideado una técnica para extraer sonidos de imágenes fijas capturadas utilizando cámaras de smartphone con obturadores rodantes y estructuras de lentes móviles.

El movimiento del hardware de la cámara, como los obturadores rodantes de óxido de metal complementario (CMOS) y las lentes móviles utilizadas para la Estabilización de Imagen Óptica (OIS) y el Enfoque Automático (AF), crea sonidos que se modulan en las imágenes como distorsiones imperceptibles.

Estos tipos de cámaras de smartphone, explican los investigadores en un artículo de investigación (PDF), crean un "canal lateral óptico-acústico de punto de vista (POV) para el espionaje acústico" que no requiere línea de visión ni la presencia de un objeto dentro del campo de visión de la cámara.

Centrándose en las limitaciones de este canal lateral, que se basa en un "camino mecánico adecuado desde la fuente de sonido hasta el smartphone" para admitir la propagación del sonido, los investigadores extraen y analizan la información acústica filtrada, identificando con gran precisión a diferentes hablantes, géneros y dígitos hablados.

Los académicos se basaron en el aprendizaje automático para recuperar información del habla humana transmitida por los altavoces, en el contexto de un atacante que tiene una aplicación maliciosa en ejecución en el smartphone pero no tiene acceso al micrófono del dispositivo.

Sin embargo, el modelo de amenaza asume que el atacante puede capturar un video con la cámara de la víctima y que pueden adquirir muestras de habla de las personas objetivo de antemano, para utilizarlas como parte del proceso de aprendizaje.

Utilizando un conjunto de datos de 10,000 muestras de emisiones de dígitos de señales, los investigadores realizaron tres tareas de clasificación (género, identidad y reconocimiento de dígitos) y entrenaron su modelo para cada tarea. Utilizaron dispositivos Google Pixel, Samsung Galaxy y Apple iPhone para los experimentos.

"Nuestra evaluación con 10 smartphones en un conjunto de datos de dígitos hablados informa precisión del 80.66%, 91.28% y 99.67% en el reconocimiento de 10 dígitos hablados, 20 oradores y 2 géneros, respectivamente", dicen los académicos.

Las cámaras de menor calidad, explican los investigadores, limitarían la fuga potencial de información asociada con este tipo de ataque. Mantener los smartphones alejados de los altavoces y agregar materiales de amortiguación de aislamiento de vibraciones entre el teléfono y la superficie de transmisión también debería ayudar.

Los fabricantes de smartphones pueden mitigar el ataque mediante frecuencias de obturación rodante más altas, obturadores rodantes de código aleatorio, resortes de suspensión de lentes más resistentes y mecanismos de bloqueo de lentes.

"Creemos que las altas precisiones de clasificación obtenidas en nuestra evaluación y el trabajo relacionado utilizando sensores de movimiento sugieren que este canal lateral óptico-acústico puede admitir aplicaciones maliciosas más diversas mediante la incorporación de funcionalidad de reconstrucción de habla en la canalización de procesamiento de señales", añadieron los investigadores.


Contenido traducido al español con fines informativos, cualquier cambio en la publicación original no será reflejada en esta entrada, favor referirse a la fuente para obtener el acceso a cualquier actualización del contenido. Para la traducción se utilizó ChatGPT, al ser una traducción automática puede contener errores gramaticales o de otro tipo, favor enviar comentarios al moderador para corregir.

Comentarios

Entradas más populares de este blog

Falsos sitios de DocuSign y Gitcode propagan NetSupport RAT mediante ataque PowerShell en múltiples etapas

Microsoft Reemplaza Aplicación de Escritorio Remoto por Windows App: Implicaciones en Ciberseguridad

El FBI advierte sobre suplantación de correo electrónico por parte del actor de amenazas norcoreano Kimsuky