Acción / Reacción

Recrean diálogo analizando vibraciones en bolsa de papas

Científicos del MIT lograron reconstruir frases dichas del otro lado de un vidrio insonorizado gracias a las sutiles vibraciones reflejadas en la bolsa de snacks. O sea que, a partir de una imagen muda, obtuvieron un sonido.

 

 

“Somos científicos y a veces vemos películas como las de James Bond y pensamos: Esto es teatro de Hollywood. Es imposible hacer eso. Es ridículo. Y, de repente, ahí está: podemos ver cómo un asesino admite su culpabilidad porque hay material de vigilancia de las vibraciones en su bolsa de papas fritas”, expresó Alexei Efros, profesor de la Universidad de Berkeley a modo de introducción al maravilloso invento que colegas suyos del MIT lograron crear.

Noticia relacionada: Increíble experimento nos permite “ver” el sonido

El equipo de investigadores, que trabajó en conjunto con Microsoft y Adobe, ideó un algoritmo que puede reconstruir una señal de audio mediante el análisis de las vibraciones de los objetos visibles en un archivo de video. Sí, como se lee: tomando una imagen muda se puede obtener el sonido que allí se produjo y que no logramos escuchar en su momento. El ejemplo de la bolsa de papas fritas no fue azaroso, fue el usado para testear dicho algoritmo. Las imágenes se tomaron a 15 metros de distancia a través de un cristal con aislamiento sonoro, y, posteriormente, se extrajeron señales de audio útiles a partir de videos que recogían el movimiento de un papel de aluminio, de la superficie de un vaso de agua e incluso de las hojas de una planta sembrada en maceta.

 

Buendiario-MIT-bolsa-papas-sonido-imagen-2

Ondas de sonido, obtenidas a partir de imágenes mudas.

 

En palabras de Abe Davis, investigador del MIT y autor principal del estudio denominado “The Visual Microphone: Passive Recovery of Sound from Video”: “Cuando el sonido choca contra un objeto, hace que éste vibre. El movimiento de esta vibración crea una sutil señal visual, generalmente invisible a simple vista”. Su hallazgo permite captar dicha vibración y traducirla. El estudio será presentado la semana que viene en Vancouver, Canadá, en el marco de la conferencia sobre computación gráfica SIGGRAPH 2014.

Noticia relacionada: Aplicación convierte formas en paisajes sonoros

La reconstrucción del audio a partir de una imagen requiere que la frecuencia de las muestras de video – es decir el número de cuadros por segundo – sea superior a la frecuencia de la señal de audio. En algunos de sus experimentos, los investigadores hicieron uso de una cámara de alta definición que captaba entre 2000 y 6000 frames por segundo, lo cual equivale a mucho más que los 60 de la cámara de algunos smartphones pero que a la vez está muy por debajo de las mejores cámaras comerciales de alta definición, que se mueven en torno a los 100.000 fps. Sin embargo, incluso usando un video tomado por un smartphone, es aún posible extraer información de las imágenes, como el número de hablantes de una habitación o su género.

Como siempre decimos: el futuro ya llegó, y está lleno de posibilidades.

Visto en The Verge

Visto en facebook gracias a Paula Félix Didier y Rui Poças

Un comentario en “Recrean diálogo analizando vibraciones en bolsa de papas”

  1. Martin dice:

    Esto mismo lo hicieron hace unos años en un capitulo de FRINGE

Dejá un comentario

Tu dirección de correo electrónico no será publicada.

Buenas noticias relacionadas