ANALIZADORES DE ESPECTRO:

Como vimos oportunamente, existen dos terrenos para la representación gráfica del audio, estos son el temporal y el espectral.

Como es de suponer, los analizadores de espectro se encuentran dentro del segundo terreno, aunque no obstante, es posible incorporar la dimensión temporal -incluida en los análisis 3D- para la observación de la variación de amplitudes en las diferentes frecuencias en función del tiempo.

Básicamente, existen dos formas de representación para la frecuencia:

A) la función lineal o logarítmica (conocida como análisis FFT)

B) la función por división o subdivisión de octavas (1/1; 1/3; 1/12; 1/24; etc)

ANALISIS FFT LINEAL

Comenzaremos reconociendo un análisis bajo estructura linear:

 

Fig. 3-1 Escala lineal

 

En una escala lineal pueden apreciarse dos ejes. El vertical para el nivel (dB), y el horizontal para representar la frecuencia (f).

En la Fig. 3-3 el eje horizontal está dividido en 5 columnas, pero en esta oportunidad no tomaremos en cuenta la última fila, por lo que analizaremos lo que ocurre entre 20 y 20.000 Hz.

Vemos entonces que en el eje horizontal tenemos repartidas 20.000 frecuencias, de menor a mayor, divididas de a 5.000 unidades. Nótese que para cada sector de 5.000 frecuencias se utiliza el mismo espacio. O sea, supongamos que se requieren 4 cm. para alinear las frecuencias comprendidas entre 0 y 5.000 Hz., en los siguientes 4 cm. se alojarán  las que van de 5.000 a 10.000 Hz, luego las comprendidas entre 10.000 15.000, finalizando en el sector que va desde 15.000 a 20.000 Hz. A este tipo de representación de escala se lo denomina "lineal". (Observe que la escala vertical también está expresada en términos lineales).

Existen dos formas tradicionales para la representación de las frecuencias: mediante barras de algún color (Fig. 3-3), o bien mostrando simplemente el contorno de las barras (Fig. 3-4). En este último sentido, muchos analizadores del tipo FFT (como el que encontramos en Steinberg Wavelab) reemplazan el contorno de barras por curvas (este es un modo muy útil para el análisis del contenido armónico de determinados sonidos)

Fig. 3-3 Gráfico por barras

 

Fig. 3-4 Gráfico por contornos

xx

clic para volver

Fig. 3-2 Representación de frecuencia bajo curvas en modo FFT

 

Ahora bien, ¿Se trata de un aspecto meramente estético, o la posibilidad de mostrar la frecuencia en barras coloreadas o mediante sus contornos cumple una función determinada?. Veamos. Si trabajamos con archivos en formato 44.1 KHz. y 16 bits, nuestro analizador deberá darnos información en intervalos de 44.100 partes por segundo acerca de la posición de la señal. Si a esto le sumamos que cada reporte puede alojarse dentro de un escalonamiento de 65.536 posiciones diferentes, el resultado final para una máquina aún moderna puede ser caótico.

Imaginemos 20.000 barras moviéndose en tiempo real, bajo el análisis antedicho. El primer obstáculo con el que nos encontraremos tendrá que ver con un tema gráfico. De hecho, resulta muy complicado para una interfase gráfica agrupar 20.000 barras en un largo de aproximadamente 25 cm. Por lo tanto, una vista por contornos resultará más útil.

Debido a que los analizadores nos permiten efectuar niveles de zoom, a determinadas escalas de ampliación una vista por barras se torna posible. Sin embargo, de acuerdo al ajuste FFT (del que nos referiremos más adelante) veremos que el problema puede ir aún más allá. Por otro lado, la observación del analizador mediante niveles de zoom puede provocar, en determinadas situaciones, una mala interpretación, ya que la vista parcial de un grupo limitado de frecuencias no dejará ver su relación de amplitud para con el resto del espectro, situación en la cual será necesaria una mayor experiencia en su utilización.

 

ANALISIS DEL RUIDO BLANCO EN FFT LINEAL

Haremos un análisis con SpectralLab de ruido blanco en función FFT lineal. Para ello iremos al menú Options > Scaling: en el sector de Frecuency Axis elegiremos "Linear". En el menú View tildaremos "Spectrum".

Cargaremos en el analizador, en el modo recorder, un archivo a 44.1 KHz. 16 bit, mono, con ruido blanco y pulsamos el botón PLAY (se recomienda bajar el volumen para realizar este tipo de pruebas). Podremos observar, tanto en los modos de display de barras como de contornos, que el gráfico que aparece mantiene su nivel promedio en perfecto equilibrio, formando de este modo una recta.

Ahora bien, supongamos que quisiéramos analizar la actividad del entorno de los 100 Hz. para un momento dado. Aunque prestemos la mayor de las atenciones, nos será imposible ubicar los 100 Hz. en medio de un sector establecido para albergar 5000 frecuencias. Podríamos decir que lo mismo sucedería, por ejemplo, a los 5.000 Hz, sin embargo nuestro sistema auditivo es mucho más preciso a baja que a alta frecuencia, por lo que un análisis más detallado en el sector izquierdo se torna más necesario, sobre todo al momento de utilizar el analizador para realizar cambios en la ecualización de un programa dado.

Si bien el analizador nos está mostrando efectivamente lo que está sucediendo, no termina de sernos realmente útil. Por otro lado, no olvidemos que la respuesta del oído, tanto en función de amplitudes como en recepción de frecuencias, es logarítmica. En otras palabras, para poder percibir la misma diferencia tonal entre dada entre 100 y 110 Hz. con respecto a los 1.000 Hz. debemos multiplicar por 10 la diferencia, o sea 1.000 y 1.100 Hz.. Por consiguiente, encontraremos la misma diferencia perceptual entre 10.000 y 11.000 Hz.

ANALISIS DEL RUIDO BLANCO EN FFT LOGARITMICA

Entonces, haremos un pequeño ajuste en "Scaling" (recuerden el menú Options), y pasaremos el eje de frecuencia a "Logarithmic". Ahora, tal como podremos ver en la Fig. 3-3, notaremos que la grilla ha cambiado. A medida que aumenta la frecuencia más cerca se alojan unas de otras. Por ejemplo, obsérvese la distancia habida entre 100 y 200 Hz. y podrá apreciarse que es la misma que hay entre 1.000 y 2.000 Hz, al igual que la encontrada entre 10.000 y 20.000 Hz.

Fig.. 3-3 Representación logarítmica para la frecuencia.

Este modo nos dará una lectura mucho más precisa acerca de lo que acontece en el sector de baja frecuencia, y, por otro lado, el gráfico se asemeja más a la respuesta del oído. Sin embargo, cuando queramos analizar finamente lo que sucede en el sector de alta frecuencia, veremos que hemos perdido precisión, ya que los mismos alrededor de 2 cm. que nos muestran 100 frecuencias (grilla 100/200Hz) ahora nos mostrarán -reitero, en el mismo espacio- 10.000 frecuencias (grilla 10.000/20.000 Hz).

Podemos, entonces, llegar a una conclusión operativa: Cuando necesitemos observar el contenido de baja frecuencia, pasaremos el modo a logarítmico, en tanto que para un detalle mejor provisto en alta frecuencia seleccionaremos linear.

 

ANALISIS DEL RUIDO ROSA EN FFT LINEAR Y LOGARITMICA

Ahora cargaremos un archivo de ruido rosa.

Fig. 3-4 Forma de onda del ruido rosa

 

Al apretar el botón Run (Play) veremos que se forma una pendiente descendente de izquierda a derecha. No es otra cosa que la pérdida de 3 dB por octava que conlleva este tipo de ruido. En este punto, ya sabemos si nos conviene ver el espectro en forma linear o logarítmica (Figs 3-5 y 3-6)

Fig. 3-5 espectro de ruido rosa con vista logarítmica

 

Fig. 3-6 espectro de ruido rosa con vista linear

 

Conclusión: tanto los modos de vista linear como logarítmico sirven para mostrarnos una representación en tiempo real del comportamiento de cada frecuencia.

De modo que cuando queramos analizar, por ejemplo, el espectro en tiempo real de una canción, este tipo de análisis (FFT) nos mostrará sin duda lo que está sucediendo en todo el rango de frecuencias. Esta vista podría ser útil para detectar problemas de ruido, sobre todo a muy bajas frecuencias -siendo que la enorme mayoría de los altavoces (incluidos los monitores de campo cercano para tareas de estudio) no nos permitirán audicionar, supongamos, un pico o sostenido en 23 Hz. También en modo FFT podremos localizar los diferentes armónicos que posee cada instrumento, o el sector de utilidad para cada fin.

Sin duda este tipo de análisis nos será de enorme utilidad al momento de utilizar todo tipo de filtros.

Sin embargo, aunque el modo logarítmico tiene cierta relación con el mecanismo de respuesta del oído, el análisis FFT no termina de mostrarnos realmente lo que estamos escuchando, sino, más bien, lo que está sucediendo. No olvidemos que si analizamos ruido blanco (igual energía por octava) nuestra percepción estará lejísimos de la recta que nos brinda el análisis FFT. O sea, lo que vemos plano, no lo oímos plano. Es importante mantener este concepto para los usos prácticos, como ser el análisis de un instrumento o de una mezcla entera.

Fig. 3-7 Análisis FFT logarítmico de la nota A2 en un piano eléctrico (obsérvese su contenido armónico)

 

ANALISIS POR DIVISIÓN DE OCTAVA

Seguimos en SpectralLab. Ahora seleccionaremos en Scaling la posición "Octave". Esto hará que las frecuencias se agrupen en octavas. No olvidemos que el término"octava" para la acústica significa el doble o mitad de una frecuencia, de modo que para 20 Hz., 40 Hz. será su primera octava superior.

Si tomamos en cuenta que el espectro audible parte de los 20 Hz. la primer división de octava abarcará de 20 a 40 Hz., o sea, contendrá 20 frecuencias en su intervalo. La siguiente división partirá de los 40 hasta los 80 Hz., contando en sí misma con el doble de frecuencias que el intervalo anterior, a la vez que la mitad de frecuencias que el siguiente intervalo. Y así sucesivamente.

Cargaremos nuevamente el archivo de ruido blanco. Ajustaremos la vista a barras. Una vez corriendo el archivo, veremos que cada barra (que representa una octava) a medida que avanza la frecuencia aumenta en amplitud.

A simple vista nos daría la idea de que se trata de un tipo de señal con mayor carga en alta frecuencia que en el sector bajo. Sin embargo, no debemos olvidar la característica principal del ruido blanco. Entonces ¿qué está sucediendo?. Ocurre que si tomamos en cuenta la Ley de Potencia (Potencia x 2 = +3 dB) resolveremos la cuestión, puesto que si cada octava -representada por una barra- contiene el doble de frecuencias que la octava inmediata inferior, y a su vez concebimos que cada frecuencia incluida en cada octava posee el mismo valor promedio de energía, encontraremos que cada octava, entonces, tiene el doble de potencia que su octava anterior, a la vez que la mitas de la siguiente.

Esto significa que si, en cambio, cargamos ruido rosa ahora todas las barras tendrán la misma amplitud. Y esto se debe a que como el ruido rosa posee una pérdida de 3 dB por octava en ascenso, al mostrarnos el analizador divisiones en las que cada octava cuenta con el doble de frecuencias, por lo que suma en 3 dB, a la vez que restándole a la octava siguiente los mismos 3 dB, nos dará por resultado una imagen plana.

Fig. 3-8 Ruido blanco en división de octava

Fig. 3-9 Ruido rosa en división de octava.

A su vez, podremos sacar una nueva conclusión: Debido a la forma logarítmica en que el oído trabaja, este tipo de representación tiene mucho más que ver con nuestro sentido de la percepción, incluso mucho más que la representación logarítmica de modo FFT. O sea, si el ruido rosa representa para nuestro oído la sensación de escucha pareja a todas las frecuencias, por ende, se trata del tipo de ruido que percibimos como lineal, el analizador expresado en división de octavas nos muestra gráficamente lo que percibimos. Vale decir: nos muestra lo que sucede, mediante una representación gráfica similar a la forma en que percibimos lo que sucede.

De esta forma podremos obtener una idea acerca del balance de una mezcla completa, o nuestro master final.  Sin embargo, un análisis medianamente profundo bajo divisiones por octava completa resultaría incierto. Debido a esto, muchos analizadores, tanto como ecualizadores del tipo gráfico, nos permiten subdividir cada octava. Por ejemplo, es posible un análisis o ecualización que divida a cada octava en dos, o en tres, y hasta en 24 partes. Esta situación se nos plantea como muy ventajosa, ya que el oído, en su expresión logarítmica, divide al espectro en tercios de octava, por lo que ahora, entre 20 y 40 Hz. se interpondrán 25 y 31.5 Hz., y así sucesivamente. Esto significa que si ajustamos el modo frecuency a 1/3 de octava, la relación entre lo que vemos en el analizador y lo que percibimos de un sonido determinado es aún mucho mayor, ya que todo el principio antedicho acerca de la división en octavas se mantiene, salvo la relación de amplitud entre un tercio y otro, que para el ruido rosa, pasa a ser de 1 dB.

Notemos que el modo de visualización en tercios de octava (y más aún en octava completa) no es el adecuado para analizar las frecuencias parciales de un instrumento determinado. Tampoco resulta el modo correcto para encontrar, por ejemplo, el sector justo de una sibilancia.

 

EN LA PRACTICA...

Los analizadores en modo FFT son muy útiles para avistar detalles del sonido, inclusive -y sobre todo- aquellos que nos resultan por diversas causas inaudibles, como ser ruidos de muy baja frecuencia. Recuerden que en muchas ocasiones el oscilograma no muestra de modo claro y sencillo todo lo que estará sucediendo a nivel frecuencial, y sin un analizador de espectro dependeríamos directamente de nuestros monitores, lo cual no suele ser lo más adecuado para detectar este tipo de problemas.

Por otro lado, un análisis FFT resulta ideal para el reconocimiento tímbrico de la mayoría de los sonidos, nos familiariza con ellos.

Recuerden que un análisis FFT linear es más útil para observar el contenido de alta frecuencia sin tener que recurrir a niveles de zoom, los cuales hacen que a veces uno se pierda del contexto, Por el contrario, un ajuste FFT logarítmico permite un análisis mucho más detallado en el sector de bajas frecuencias. Sin embargo, para un análisis eficaz de baja frecuencia será necesario aumentar el valor del parámetro FFT. En este punto no debemos confundirnos: si bien a este tipo de organización de la frecuencia se lo conoce como "análisis FFT", El propio ajuste de la FFT es un factor aparte, común a todos los modos de análisis, incluso a los de división de octava.

Por último, con respecto al modo de análisis FFT, diremos que es muy práctico en software de grabación multitrack, insertar un módulo en los buses de entrada, e incluso en el último zócalo del insert de cada canal, aunque por una cuestión de consumo de CPU pueden apagarse mientras no sean necesarios. También es posible armar un canal de subgrupo y proveerlo de estas herramientas, tanto como de osciloscopios y medidores de fase. Así, cuando se quiera analizar un canal, se le da salida por el subgrupo. Esto también permite el análisis de un conjunto de canales en función de su propia mezcla.

 

Pasemos entonces al modo de división de octava. Más precisamente al de subdivisión, o sea 1/3 de octava. El análisis bajo este modo nos dará una idea del balance general de nuestra mezcla, ya no tan relacionado con la propiedad física de cada componente, sino más bien orientado a contemplar gráficamente la forma en que sonará para nuestros oídos aquello que estemos analizando.