Desde 1995 trabajo con experimentación sonora y por lo tanto audio digital. Aquí envío mis apreciaciones sobre lo que escuche ayer en el audio y luego pude analizar usando las herramientas adecuadas para el caso.
La imagen es un fragmento del audio que supuestamente fue grabado por Mario Silva, aquí no trato de defender a nadie, si no desmontar tecnicamente otro ataque en el campo de la guerra psicológica.
Explico que pasa aquí: Esto es una representación FFT (fast fourier transform)[1] de una señal de audio, una frase de la grabación presentada ayer por Ismael Garcia. Hay varias cosas notables en este caso tratándose de una grabación de "campo" y "lineal". Para aquellos que no conocen del tema voy a explicar algo tratando de ser lo mas claro posible: un sonido es la suma de varias frecuencias, la voz humana tiene un rango de frecuencias determinado con una frecuencia primaria, armónicos y sub armónicos que no son evidentes para el oído pero si para un grabador de audio y un micrófono. En cualquier lugar donde se haga una grabación existe el "ruido ambiente", el ruido no es otra cosa que la suma de todas las frecuencias, es registrado por las grabadoras digitales y se podría comparar con el grano de una fotografía.
Primero es la falta de "ruido de ambiente", que en la imagen se muestra con las manchas oscuras casi negras. En este caso se eliminó el sonido de ambiente para que la edición fuera mas fluida y no se escuchen los cortes, ya que un corte en la edición de audio con ruido de ambiente es muy notable.
Segundo, en la imagen aparecen dos picos (pico se entiendo como un tope en la aptitud -volumen- de un sonido, en este caso es amarillo tirando a blanco y su lectura es vertical ya que contiene casi todas las frecuencias), uno del lado izquierdo y otro casi en el centro a la derecha, estos picos son muy comunes cuando un audio es picado y pegado en un programa como Adobe Audition.
Tercero y lo mas interesante para el análisis es la diferencia entre palabras donde se notan distintas características entre ellas, dando a entender que pertenecen a grabaciones distintas. La falta de "ruido" (en negro) y la diferencia entre las frecuencias eliminadas de nuevo sugieren que el audio fue armado y no es una grabación lineal y fidedigna. (abajo los graves arriba los agudos). En este caso hay que usar audífonos profesionales para poder escuchar las diferencias entre una palabra y otra, en un televisor pasa desapercibido, pero no con audífonos.
El color negro es ausencia de sonido, amarillo y rojo indica la amplitud (volumen) y de izquierda a derecha es el tiempo.
La segunda imagen es una grabación de mi voz hecha con un grabador de campo digital Roland R-9 sin manipular, en la imagen se ven entre las dos columnas de color naranja-amarillo el ruido de ambiente y las trazas en el rango de la voz son idénticas ya que la grabación es lineal y no ha sido modificada.
[1]
aquí mas información sobre FFT en ingles:
http://en.wikipedia.org/wiki/ Fast_Fourier_transform
http://en.wikipedia.org/wiki/
Atentamente Emiliano Hernandez-Santana.