Wavelets portugues

Audio Engineering Society

Convention Paper Presented at the 123rd Convention 2007 October 5–8 New York, NY

Caracterização Tempo-Frequência da Resposta de Sistemas Eletroacústicos através da Análise Wavelet

DANIELE PONTEGGIA1, MARIO DI COLA2

1 Audiomatica, Firenze, 50136, Italy ([email protected]) 2 Audio Labs Systems, Milano, 20068, Italy ([email protected])

Um sistema eletroacústico pode ser caracterizado pela medição de sua resposta ao impulso (IR). Normalmente a IR coletada é então processada por meio da transformada de Fourier para que se obtenha a resposta em frequência complexa. A IR e a resposta em frequência complexa constituem duas perspectivas equivalentes do mesmo fenômeno. Uma representação alternativa no domínio conjunto tempo-frequência da resposta do sistema pode ser obtida através da transformada wavelet e de uma visualização de seu gráfico em mapa de cores. O presente trabalho ilustra a implementação da transformada wavelet em um software de medição comercial e apresenta alguns resultados práticos em diferentes tipos de sistemas eletroacústicos.

1. Introdução

A presente obra é fruto de uma pesquisa anterior a respeito de filtros crossover de fase linear [1] onde os autores pretenderam demonstrar de modo simples a distorção temporal provocada por diferentes tipologias de crossover. Durante essa pesquisa percebeu-se que as ferramentas disponíveis para investigar o comportamento temporal de sistemas de alto-falantes não são de fácil manejo e, se não utilizadas adequadamente, também podem levar a conclusões equivocadas.

A relação entre fase e tempo de sistemas eletroacústicos é bem documentada na literatura técnica. Não obstante, provavelmente devido à dificuldade em se apreender essa relação, a resposta em fase ainda é frequentemente considerada como secundária em relação à resposta em módulo. A

experiência direta do autor, confirmada por estudos recentes [2], é que a distorção temporal da resposta de um sistema de alto-falantes está diretamente relacionada à qualidade sonora.

O emprego da teoria wavelet neste campo não é novidade: trabalhos anteriores a respeito da aplicação dessa teoria na análise da resposta de sistemas eletroacústicos devem ser creditados a Keele [3], Gunness [4] e Loutridis [5]. O último em particular apresenta um tratamento muito detalhado do assunto e uma boa bibliografia, ainda que nesse artigo seja pobre a parte de visualização gráfica dos resultados das análises. Os gráficos do tipo waterfall, na opinião do autor, não são de fácil compreensão. Representações na forma de mapas de cores são preferíveis. Nesse sentido, o trabalho realizado por David Gunness certamente foi uma fonte de inspiração. Isso não apenas devido à apresentação

Ponteggia, Di Cola – Caracterização Tempo-Frequência da Resposta de Sistemas Eletroacústicos através da Análise Wavelet

- 2 -

dos resultados da análise em formatos gráficos adequados, mas também por sua abordagem no cálculo da distribuição tempo-frequência através da suavização complexa e, ultimamente, pelas aplicações da nova ferramenta à análise e melhoria da resposta de sistemas eletroacústicos.

A teoria wavelet é um assunto bastante recente, e foi desenvolvida inicialmente para aplicações de âmbito geológico, mas seu emprego difundiu-se rapidamente para campos diversos. Atualmente há uma enorme quantidade de artigos e livros científicos sobre o assunto: uma busca web pelo termo wavelet retorna milhares de resultados. Tal quantidade de recursos pode confundir o iniciante, resultando uma grande dificuldade de aprendizado. Consideramos particularmente útil o artigo de Rioul e Vetterli [6] como uma introdução acessível e concisa sobre o assunto.

2. Caracterização do Sistema Eletroacústico

Um sistema eletroacústico, ao menos em sua parte linear, pode ser descrito por meio de sua resposta ao impulso (IR). A IR é normalmente coletada através de instrumentos de medição computadorizados, posicionando-se o microfone a certa distância do sistema sendo testado (DUT) (Figura 1).

Fig 1: Típico sistema de medição computadorizado.

Como a IR é armazenada em um computador, é possível pós-processar facilmente a informação utilizando-se os algoritmos Fast Fourier Transform (FFT), alternando entre a IR e a resposta em frequência complexa. Também é possível realizar pós-processamentos mais complexos, como o cálculo do envelope do sinal analítico (Energy Time Curve ETC) [7], a análise do conjunto tempo-frequência, como o

Cumulative Spectral Decay (CSD) e o Short Time Fourier Transform (STFT) [8].

A IR e a resposta em frequência complexa são dois modos de ver o mesmo fenômeno, ligados por meio da transformada de Fourier (FT). Devido à natureza da FT, que é baseada em um núcleo de sinal de energia infinita, é difícil obter informações do domínio de tempo a partir da resposta em frequência complexa e é igualmente difícil obter informações do domínio de frequência a partir da IR.

Neste trabalho utilizaremos a transformada de Fourier em sua forma radial:

2.1. Resposta ao Impulso

A resposta ao impulso h(t) de um sistema eletroacústico descreve o comportamento linear do sistema. Por meio da convolução integral é possível predizer a saída y(t) do sistema dado qualquer estímulo x(t). Analisando-se a IR, o comportamento temporal do sistema pode ser facilmente compreendido. A propósito, não se consegue extrair informações detalhadas no domínio de frequência lendo-se a IR. Ao analisar uma resposta ao impulso, um técnico experiente consegue apenas algumas indicações rudimentares no domínio de frequência.

Como exemplo, a IR de um sistema profissional de duas vias é ilustrada na Figura 2. Pode-se observar claramente que os agudos e os graves não estão bem alinhados, porém, ao mesmo tempo, apenas a partir do gráfico IR talvez não seja tão fácil afirmar qual é sua discrepância em milissegundos ou quais bandas de frequência estão envolvidas.

A fim de obtermos mais informação no domínio de tempo, há alguns pós-processamentos da IR que podem ser empregados; ilustraremos o Step Response e o Energy Time Curve (ETC).


- 3 -

Fig. 2: Resposta ao impulso de um sistema

eletroacústico de duas vias.

Fig. 3: Resposta Step de um sistema eletroacústico de

duas vias.

Fig. 4: Gráfico ETC de um sistema eletroacústico de duas vias.

A resposta STEP é, como implícito no nome, a resposta do sistema a uma função de grau; é uma medida qualitativa da coerência temporal do sistema eletroacústico, mas fornece pouca informação no domínio de frequência. A resposta Step do sistema de duas vias está reproduzida na Figura 3.

O ETC é definido como o envelope do sinal analítico. O sinal analítico é uma grandeza complexa, com uma parte real igual a IR e outra parte imaginária calculada por meio da transformada de Hilbert da IR. O ETC não representa diretamente a energia presente no sistema; pode ser interpretado como a medida do módulo da resposta ao impulso, visto que o envelope remove as ondulações negativas da IR. Do nosso ponto de vista, podemos afirmar que não há informações relevantes a respeito da frequência no diagrama ETC. A Figura 4 ilustra um diagrama ETC do sistema de duas vias já mencionado.

Nenhuma dessas representações no domínio de tempo nos fornece informações claras no domínio de frequência.

2.2. Resposta em Frequência Complexa

A resposta em frequência complexa H(ω) de um sistema é obtida através da transformada de Fourier da resposta ao impulso h(t). A resposta em frequência é outra descrição completa do comportamento linear do sistema eletroacústico. Por meio do produto da transformação do sinal de entrada X(ω) e da resposta em frequência complexa H(ω) pode-se predizer a saída Y(ω) do sistema.

Neste caso é possível obter alguma informação sobre o comportamento temporal do sistema analisando-se sua resposta em frequência complexa. É uma prática comum verificar o alinhamento temporal do sistema eletroacústico analisando o comportamento de sua resposta em fase.

Na verdade, se definirmos o sistema perfeito como um sistema com módulo plano e fase linear na banda de nosso interesse, então poderemos notar como o sistema não cria distorção de amplitude nem gera distorção de fase (com exceção de um eventual atraso total que permanece constante com a frequência). A resposta ao impulso de um sistema desse tipo se apresenta como uma função similar a um seno cardinal girado no tempo pelo atraso total do sistema.

Uma relação direta entre a fase e o tempo só pode existir no caso em que a resposta do sistema seja do tipo passa-tudo. Apenas nesse caso o negativo da


- 4 -

derivada da resposta em fase (atraso de grupo) representa exatamente o atraso de tempo do sistema. Se um sistema não é passa-tudo, não é possível definir um único instante de chegada em função da frequência. Mesmo em sistemas simples, por exemplo um filtro passa-altas, a energia (em função da frequência) não chega em um único instante de tempo [9] [10].

Fig. 5: Modelo de fonte puntiforme em posição conhecida.

De modo geral, é possível notar que tipicamente ocorre uma distorção temporal da energia na saída do sistema. Se alimentarmos um sistema com um sinal, podemos medir, na sua saída, uma versão modificada do sinal: os componentes de frequência podem exibir níveis diferentes e provavelmente haverá alguma distorção de fase, que resulta na distorção temporal do sinal.

Uma das maiores dificuldades que encontramos ao tentarmos analisar a fase em uma resposta em frequência complexa reside nas condições de medição e nas suposições mais ou menos implícitas que fazemos durante a medição. Quando se mede um sistema eletroacústico, se mede a resposta combinada do sistema e do ambiente em que é realizada a medição. Numa abordagem mais ampla do problema, precisamos introduzir no modelo de medição toda a cadeia de áudio, desde o emissor até o receptor. É possível considerar um modelo simplificado que inclua apenas o sistema eletroacústico e a propagação direta do som, supondo que os demais componentes sejam lineares, que o ambiente de medição seja anecóico (ou semi-anecóico utilizando-se o windowing IR) e que o ar seja calmo e quieto.

Neste caso, a resposta medida é composta pela resposta do sistema eletroacústico HDUT(ω) e por um término de propagação HPROPAGATION(ω):

Caso a distância entre o sistema medido e o microfone de medição seja menor que alguns metros, podemos desprezar a absorção de certas frequências pelo ar e considerar o término HPROPAGATION(ω) como um mero delay. Mesmo com tais suposições, permanece difícil recuperar a resposta do sistema eletroacústico, visto que está imersa no componente de propagação (Figura 6).

Há diversos modos de remover a parte de propagação e recuperar a resposta do sistema: entretanto, é necessário criar um modelo para a medição e estabelecer algumas premissas a priori.

Uma das soluções possíveis é modelar o sistema como uma fonte puntiforme posta em uma posição conhecida (Figura 5) e medir a distância d entre a posição de referência (RP) do emissor e o microfone.

Uma vez conhecida a distância d, é possível calcular o tempo de atraso devido à propagação Tdelay:

então o delay Tdelay pode ser matematicamente removido de Hmeas(ω) por meio da relação:

Uma solução alternativa, utilizada por alguns sistemas de medição (em particular aqueles que medem a função de transferência em modalidade live), consiste em estabelecer o valor do atraso no momento em que a resposta ao impulso apresente seu valor máximo. A Figura 7 mostra a resposta em frequência complexa após a remoção do atraso utilizando como valor o tempo no qual a IR atinge seu pico.

Uma terceira solução é baseada no atraso de grupo da fase excesso. Utilizando a transformada de Hilbert é possível separar a resposta em fase medida Hmeas(ω) em duas contribuições distintas: a parte fase mínima Hminimum(ω) e a parte fase em excesso:


- 5 -

O atraso de grupo calculado da parte de fase em excesso fornece uma leitura do atraso de tempo em função da frequência. Se for possível encontrar uma parte do espectro onde o atraso de grupo da fase em excesso seja constante, isso significa que o Hmeas(ω) medido é a fase mínina naquela banda. Utilizando esse valor é possível separar o atraso Hdelay(ω) da resposta do sistema.

Felizmente, o conhecimento exato da fase da resposta em frequência complexa não é estritamente necessário. As respostas medidas são utilizadas em softwares de simulação e design bastante robustos quanto ao valor exato do atraso do sistema. Na verdade, estes normalmente conseguem lidar com valores relativos que podem ser vinculados a um ponto de referência comum.

Supondo que tenhamos removido o atraso devido ao contexto de medição, resta ainda uma certa ambiguidade na leitura do diagrama de fase. A resposta em fase comumente é representada num diagrama de frequências logarítmico porque em geral compartilha a mesma escala de frequências utilizada para a resposta em módulo. E mesmo que isso possa ser útil em alguns casos porque os desvios de algum comportamento específico podem ser facilmente identificados (i.e. quando o diagrama em fase está plano), ao mesmo tempo, a interpretação genérica da linearidade pode ser problemática. Como exemplo, na Figura 9 temos o diagrama de um atraso puro em ambas as escalas.

Parece claro que tanto a IR quanto a resposta em frequência complexa são inadequadas à análise do domínio conjunto tempo-frequência característico da resposta do sistema; devem ser pensadas como fotos tiradas do mesmo fenômeno a partir de dois ângulos completamente distintos.

Fig. 6: Fase da resposta em frequência do sistema de duas vias, atraso não removido.

Fig. 7: Fase da resposta em frequência do sistema de

duas vias, atraso removido.

Fig. 8: Resposta em frequência complexa do sistema de duas vias, atraso removido.

Fig. 9: Fase linear (atraso puro) representada em

escalas linear e logarítmica.


- 6 -

Fig. 10: CSD waterfall do sistema de duas vias.

Fig. 11: STFT waterfall do sistema de duas vias.

2.3. Cumulative Spectral Decay

O Cumulative Spectral Decay (CSD) é uma descrição no domínio conjunto tempo-frequência, e permite visualizarmos o declínio da energia de um sistema. O CSD é calculado por meio da transformada de Fourier de seções progressivamente menores da IR. Os fenômenos de maior duração permanecem inclusos nas seções posteriores. Então, observando a evolução do módulo da resposta em frequência, é possível detectar os componentes mais duradouros da IR.

Um exemplo da representação CSD num diagrama waterfall para o nosso sistema de duas vias está na Figura 10.

2.4. Short Time Fourier Transform (STFT)

A idéia por detrás da STFT consiste em seguir a evolução temporal da IR por meio de seccionamentos da própria IR e da aplicação da transformada de Fourier às suas partes:

O problema que surge com a STFT é que sua resolução tempo-frequência é fixa ao longo de todo o plano tempo-frequência; a mesma janela temporal é aplicada a todas as frequências. Assim sendo, a escolha de uma janela FFT curta, com uma alta resolução de tempo, implica uma baixa resolução de frequência; por outro lado, a escolha de uma janela FFT longa melhora a resolução de frequência, mas acarreta a perda da resolução de tempo. A STFT poderia ser uma ferramenta válida apenas para a análise de bandas estreitas ou de eventos de curta duração; porém é de pouca utilidade quando empregada para sinais de banda larga e de longa duração como a resposta de sistemas eletroacústicos.

Para superar as limitações da STFT é possível pensarmos no emprego de diferentes janelas temporais para diferentes bandas de frequência, criando de fato uma STFT multiresolução. Isso pode ser feito calculando-se um conjunto de STFTs com diferentes dimensões de FFT e depois recombinando-se os resultados num mesmo gráfico. Recentemente foi apresentado um resultado interessante na aplicação dessa técnica para o reconhecimento do sinal musical [11], porém não foi realizada nenhuma aplicação à caracterização de sistemas eletroacústicos.

Podemos também citar outro instrumento de análise conjunta tempo-frequência como a distribuição de Wigner-Ville. Essa distribuição já foi empregada na análise de sistemas eletroacústicos [12], mas devido aos artefatos que exibe a sua interpretação resulta muito difícil.

3. Transformada Wavelet Contínua

A transformada wavelet contínua (CWT) de um sinal h(t) é definida como o produto escalar:


- 7 -

entre a resposta ao impulso h(t) e uma versão em escala e traduzida de uma função ψ(t) denominada wavelet mãe:

onde o fator 1/√|a| está introduzido para assegurar a normalização de energia para qualquer escala a.

Assim, a CWT pode ser escrita como se segue:

Fig. 12: Comparação entre as resoluções da wavelet e da STFT: região de influência de um impulso de Dirac

(acima) e três senóides (abaixo).

A fim de reconstruir perfeitamente o sinal com uma CWT inversa através do coeficiente Wh(a,b), a wavelet mãe deve satisfazer a condição de admissibilidade:

onde Ψ(ω) é a transformada de Fourier de ψ(t).

Como consequência da condição de admissibilidade, a função ψ(t) deve ser uma resposta ao impulso de banda limitada, e o nome wavelet deriva do próprio fato de que esse tipo de sinal tem o aspecto de uma pequena onda (ondaleta) [13]. Há diversas interpretações físicas possíveis da transformada wavelet, que em boa parte consiste de um mapeamento unidimensional do tempo de resposta ao impulso h(t) em um espaço bidimensional com um fator de escala a e uma tradução no tempo b [14].

Visto que a função wavelet mãe ψ(t) vem escalada e não modulada como no caso do kernel da STFT, a análise wavelet é chamada tempo-escala em vez de

tempo-frequência. A mudança dos parâmetros a e b não tem efeito sobre a forma do kernel da transformação, mas a resolução de tempo e de frequência dependem do fator de escala a. Na análise de frequências altas (pelo baixo valor de a) temos uma boa resolução no tempo, mas uma resolução pobre em frequência; por outro lado, para frequências baixas (pelo alto valor de a) temos uma boa resolução em frequência mas uma resolução pobre em tempo. Portanto, a análise wavelet pode ser compreendida como uma análise de Q ou banda constante e, por tal razão, se adapta muito bem à análise de sinais não-estacionários de banda larga, como a resposta ao impulso de sistemas eletroacústicos.

Fig. 13: Wavelet mãe (parte real) com BW de 1/3 de oitava.

Fig. 14: Wavelet mãe (parte real) com BW de 1/6 de oitava.

3.1. Escalograma

O espectrograma é uma forma de representação da energia de um sinal no domínio tempo-frequência e é definido como o modulo quadrado da STFT.


- 8 -

Similarmente, é possível definir o escalograma como o módulo quadrado da CWT. A energia do sinal pode ser representada em função do fator de escala a e da tradução no tempo b:

O valor |Wh(a,b)|2 pode ser representado em forma de gráfico de mapa de cores, com tempo no eixo x e frequência no eixo y, usando uma gradação de cores para indicar em cada ponto do domínio o valor de módulo quadrado associado. Na verdade, essas são versões modificadas do fator de escala a e tradução b. Uma vez definida a wavelet mãe, é possível definir uma frequência central para a wavelet e assim expressar a escala a em termos de uma frequência equivalente. O parâmetro b pode ser diretamente interpretado como tempo.

3.2. Resolução Tempo-Frequência

A idéia por detrás da CWT é usar um conjunto de funções de base que permita uma resolução tempo-frequência ótima. É possível definir o centro temporal tψ e espectral ωψ da função de base da transformada wavelet como:

Também é possível definir a largura do intervalo temporal ∆tψ e espectral ∆ωψ:

O produto tempo-frequência é limitado pelo princípio de indeterminação tempo-frequência:

É possível demonstrar que a função que minimiza o produto é o impulso Gaussiano. De fato, a energia desse sinal é razoavelmente concentrada tanto no domínio de tempo quanto no domínio de frequência, mas ao mesmo tempo não é limitada em nenhum dos dois domínios. Assim sendo, um impulso Gaussiano modulado é um ótimo candidato para a wavelet mãe.

Fig. 15: Tempo de cálculo – 32k MLS.

Fig. 16: Tempo de Cálculo – 128 escalas.


- 9 -

3.3. Wavelet Mãe

Em acordo com Loutridis, escolhemos usar como wavelet mãe uma wavelet Morlet complexa modificada:

Devemos notar que essa função é composta de um termo complexo de oscilação ejωot e de um fator de decaimento e–t2/B como requisito da condição de admissibilidade. Também devemos notar que, em nosso caso, a condição de admissibilidade pode ser relaxada, visto que estamos interessados na análise das propriedades do sinal e não em sua reconstrução.

A transformada de Fourier da wavelet mãe é:

A resolução de tempo e frequência da wavelet escolhida pode ser calculada das definições anteriores:

É possível indicar o parâmetro B como função da largura de banda da análise BW ou do fator Q:

4. Cálculo do Coeficiente da Wavelet

O cálculo do coeficiente da transformada wavelet diretamente da equação (12) é muito dispendioso do ponto de vista computacional.

No início desta pesquisa foi realizada uma série de tentativas de cálculo direto do coeficiente no Matlab, mas o tempo de cálculo e a resolução do resultado não se mostraram satisfatórios.

4.1. Algoritmo de Cálculo

Podemos utilizar uma abordagem alternativa baseada na transformada de Fourier convencional. Através da FT e de sua propriedade de tradução em tempo e frequência é possível calcular a transformada de Fourier da função do kernel da transformada wavelet:

Da equação (10) e utilizando a relação de Parseval obtemos:

essa é a forma de uma transformada de Fourier inversa do produto do conteúdo espectral do sinal H(ω) e o complexo conjugado da função wavelet mãe escalada Ψ(ω), exceto por um termo 1/√2π.

Dado o fator de escala a, é possível calcular o coeficiente da transformada wavelet contínua utilizando a implementação numérica convencional da transformada de Fourier, da Fast Fourier Transform (FFT) direta e da Fast Fourier Transform inversa (IFFT):

Repetindo esse procedimento numérico por um certo número de valores de fator de escala a se obtém uma matriz bidimensional do coeficiente Wh(a,b) que depois pode ser elaborada parar criar um gráfico de mapa de cores. Visto que a resolução da representação gráfica é ligada à alta resolução da mídia de visualização (tipicamente uma tela de computador), não é necessário calcular a matriz para mais que algumas centenas de valores de a.

A análise wavelet foi implementada no sistema de medição CLIO e, a fim de permitir uma efetiva usabilidade do instrumento de análise, foi realizada


- 10 -

uma série de testes de tempo de cálculo (Figuras 15 e 16).

Observamos experimentalmente que o melhor resultado em termos de velocidade de cálculo e precisão de resultado é obtido por um número de escala entre 27 e 28, sendo que nesse caso o tempo de cálculo sempre permanece abaixo de 60 segundos, mesmo em uma máquina modesta. Ainda que, em teoria, um pós-processamento possa ser prolongar-se por uma quantidade de tempo praticamente ilimitada, é opinião do autor que uma resposta razoavelmente rápida é importante para a aplicação prática do instrumento de análise wavelet.

5. Representação Gráfica

Para representar o escalograma, como mencionado, optamos pelo emprego do mapa de cores. Segundo a experiência do autor, essa representação permite uma visualização clara do andamento do fluxo de energia no sistema. Enquanto que em diagramas de módulo vs. tempo e módulo vs. frequência apenas um domínio pode ser representado claramente, o mapa de cores do escalograma nos permite visualizar o domínio conjunto tempo-frequência. Qualquer tentativa no sentido de interpretar os resultados em termos de um só domínio está destinada ao fracasso.

Uma vez a matriz do coeficiente da wavelet Wh(a,b) seja calculada para um certo número de valores do fator de escala a, i.e. para um certo número de frequências, podemos então visualizar o escalograma. O mapa de cores é feito utilizando-se um algoritmo de interpolação bilinear a partir do ponto disponível no plano tempo-frequência.

5.1. Normalização

Também aplicamos a normalização de escala ao escalograma para proporcionar um melhor resultado gráfico e, assim, torná-lo mais inteligível. Essa normalização tem o mesmo resultado que ignorar a normalização de energia apresentada na equação (11).

Fig. 17: Análise wavelet de um sistema perfeito.

Fig. 18: Análise wavelet de um sistema de duas vias, BW 1/3 de oitava.

Fig. 19: Análise wavelet de um sistema de duas vias, BW 1/3 de oitava, com normalização de nível.


- 11 -

Fig. 20: Análise wavelet de um sistema de duas vias,

curva de tempo de chegada de pico de energia.

Fig. 21: Análise wavelet de um sistema de duas vias, BW 1/6 de oitava.

Fig. 22: Análise wavelet de um sistema de duas vias, BW 1/6 de oitava, com normalização de nível.

A Figura 17 exibe um escalograma da análise wavelet de um impulso de Dirac. Essa é a resposta de um sistema perfeito; portanto, essa é a resposta-alvo da análise wavelet de todo sistema eletroacústico linear.

A Figura 18 ilustra a análise wavelet do sistema eletroacústico profissional de duas vias mencionado anteriormente.

Se a análise wavelet for utilizada para o estudo do decaimento de energia ou do alinhamento temporal de um sistema, o escalograma pode ser posteriormente normalizado em nível. Neste caso, cada linha do escalograma, onde o coeficiente é calculado pela equação (33), é normalizada ao seu valor máximo. Daí resulta a diferença energética entre os diferentes fatores de escala não considerados, resultando em uma visualização mais clara do decaimento de energia no sistema. Esse tipo de visualização é muito similar àquela de um conjunto de curvas ETC calculado em sua versão de banda estreita de resposta ao impulso.

Como exemplo, mostramos na Figura 19 a análise wavelet do mesmo sistema de duas vias normalizada em nível.

Também é interessante mostrar o gráfico da curva de tempo de chegada do pico de energia, i.e. a curva que conecta os pontos de máxima energia em cada linha do escalograma. A Figura 20 mostra o gráfico de tempo de chegada do pico de energia na forma de uma curva traço-pontilhada sobre o escalograma. Nessa figura o escalograma foi intencionalmente enfraquecido para enfatizar a presença da curva.

5.2. Balancear Resolução no Tempo e na Frequência

O produto da largura temporal e espectral é uma quantidade fixa; o parâmetro BW da análise wavelet permite balancear a resolução no domínio de tempo com a resolução em frequência. Percebemos experimentalmente que os valores ótimos para o parâmetro BW oscilam entre um terço e um doze avos de oitava.

Nas Figuras 21 e 22 vemos a análise wavelet do sistema de duas vias com parâmetro BW 1/6 de oitava. Nota-se a menor resolução no tempo e a maior resolução em frequência em relação à análise anterior de 1/3 de oitava.


- 12 -

6. Aplicação

Nesta seção gostaríamos de apresentar algumas medições de sistemas reais nos quais a aplicação da ferramenta de análise wavelet (WAT) revelou-se um instrumento muito útil e prático. O desenvolvimento da própria WAT originou-se da consciência de que uma ferramenta de análise do conjunto tempo-frequência era muito desejável a fim de se obter uma compreensão mais completa de algumas características de tempo-frequência-módulo relacionadas a transdutores específicos ou a sistemas eletroacústicos completos. As informações que podem ser coletadas analisando-se uma resposta ao impulso com a WAT geralmente estão relacionadas a alguns assuntos específicos: a resposta no tempo de um transdutor (por vezes acoplado a um dispositivo como guia de onda), o decaimento da energia de um sistema eletroacústico e o alinhamento temporal de um transdutor em um sistema de múltiplas vias.

6.1 Difusor Profissional 8” de Duas Vias

Examinemos um sistema eletroacústico profissional equipado com um woofer de 8” e um driver de compressão de 1” acoplado a um guia de onda de cobertura constante. Esse sistema simples representa um exemplo bastante comum de aplicação da WAT. Poderíamos ter interesse, neste caso, em analisar como duas estratégias de crossover distintas podem afetar o alinhamento temporal entre os drivers e qual dos dois poderia ter um melhor desempenho em termos de coerência temporal.

Isso pode ser obtido facilmente, e esse é exatamente o caso, sendo o módulo de resposta em frequência para ambos os alinhamentos praticamente idêntico (Figura 23). Comparando a curva da resposta em fase (Figura 24) é possível vermos claramente que a rotação de fase imposta ao sistema processado com crossover de fase linear (LPC) (curva azul) é decididamente menor que aquela imposta ao mesmo sistema quando processado com uma rede de crossover passa-tudo (APN). Numa publicação anterior demonstramos, com mais detalhes, as performances temporais obtidas de um sistema eletroacústico sendo processado por várias estratégias de crossover diferentes. Neste caso, observando os resultados da WAT para as duas abordagens, vemos a clara evidência de melhora na resposta temporal do sistema que resulta do LPC se comparado com a abordagem APN (Figura 26). O resultado da análise WAT obtido com a abordagem APN mostrado na Figura 25 demonstra, neste caso,

que a energia emitida pelo transdutor de alta frequência precede aquela do woofer em uma certa quantidade de tempo. Esse atraso nas frequências baixas é consequência direta do atraso de grupo em banda passante associado ao filtro passa-baixas se comparado com aquele do filtro passa-altas. A abordagem APN não compensa essa distorção temporal de modo algum. A abordagem LPC, por outro lado, emprega o filtro FIR de fase linear que possui um atraso de grupo fixo e constante para cada banda; uma vez compensado o atraso de tempo geométrico, nenhuma distorção temporal é introduzida na resposta do sistema. A Figura 27 mostra a resposta do sistema com crossover LPC com ambos os transdutores conectados com a polaridade correta (curva vermelha) e com um dos transdutores com a polaridade invertida (curva azul). É interessante ver o resultado da análise wavelet do sistema conectado de maneira imprópria; a Figura 28 revela de modo claro o evidente fenômeno de cancelamento de fase.

6.2. Elemento Array Vertical de Três Vias

A fim de ilustrar mais algumas aplicações do módulo CLIO WAT no estudo do alinhamento temporal entre vários transdutores em sistemas de múltiplas vias, citamos novamente a publicação mencionada acima. O sistema array vertical de três vias que agora analisamos é muito similar ao sistema que foi ilustrado em tal publicação, porém em maiores proporções. Um olhar rápido no gráfico de resposta em frequência (Figura 29) mostra que o sistema processado com seu crossover original e com outro crossover implementado com o filtro FIR de fase linear apresenta resposta praticamente idêntica, sendo que as pequenas diferenças são de influência nula. As curvas da resposta em fase, pelo contrário, são notavelmente diferentes uma da outra (Figura 30). A resposta em fase do crossover original é representada pela curva vermelha enquanto que a curva azul representa a resposta do sistema com o conjunto de fase linear. A análise wavelet da resposta ao impulso obtida com o crossover original (Figura 31) mostra que a abordagem de crossover escolhida, apesar de seu efeito positivo na redução da rotação de fase total em respeito a um crossover APN hipotético do tipo passa-tudo de três vias, exibe claros sinais de distorção temporal. O midrange claramente precede as saídas de alta e baixa frequências. A análise wavelet aplicada ao mesmo sistema processado com crossover de fase linear (Figura 32) mostra sem sombra de dúvida a melhoria de coerência e a redução de distorção temporais, emitindo quase toda a energia em sincronia dentro de praticamente todas as bandas.


- 13 -

6.3. Driver de Compressão Acoplado a uma Corneta de Diretividade Constante

Uma das características mais comuns das cornetas de diretividade constante (CD) é o slot de difração utilizado na garganta da corneta. Visto que cornetas HF de formato grande e amplo ângulo de cobertura utilizam drivers que possuem uma saída na faixa de 1.5” ou 2” de diâmetro, a corneta não pode ser de forma completamente cônica. A razão disso é que, dado o diâmetro do transdutor utilizado, a diretividade em altas frequências será determinada pela diretividade inerente ao próprio driver nessas frequências. Para manter um amplo ângulo de cobertura até o extremo superior da banda de áudio é prática comum acoplar o driver a uma porção exponencial da corneta que termina em um brusco restringimento que por sua vez provoca uma difração na porção cônica subsequente da corneta. Esta última é comumente seguida por uma seção cônica adicional com abertura mais acentuada. A energia sonora que chega ao slot de difração não é irradiada completamente na seção cônica. Uma parte da energia é refletida para a garganta do driver devido à brusca mudança na forma da superfície no ponto de difração. Isso gera reflexões. A análise wavelet aplicada à resposta ao impulso desse tipo de corneta pode mostrar quanta energia é refletida ao interior da corneta e quais bandas de frequência são essencialmente afetadas pelo fenômeno naquela corneta em específico. A resposta em frequência na Figura 33 mostra claramente o efeito dessas reflexões e na Figura 34 vemos o aspecto do resultado da análise WAT. Mesmo que o guia de onda medido mostre de modo evidente o efeito da reflexão no slot de difração, este permanece bastante representativo da qualidade média que se pode encontrar nas cornetas de difração e ampla cobertura angular utilizadas nos sistemas profissionais. Nos guias de onda de cobertura muito ampla que se vêm utilizando atualmente na maioria dos sistemas de array vertical o efeito do slot de difração é ainda pior.

Fig. 23: Módulo da resposta em frequência do sistema profissional 8” de duas vias.

Fig. 24: Fase da resposta em frequência do sistema profissional 8” de duas vias.

Fig. 25: Análise wavelet do sistema profissional 8” de duas vias, caso APN.


- 14 -

Fig. 26: Análise wavelet do sistema profissional 8” de

duas vias, caso LPC.

Fig. 27: Módulo da resposta em frequência do sistema profissional 8” de duas vias, caso LPC com polaridade

invertida.

Fig. 28: Análise wavelet do sistema profissional 8” de duas vias, caso LPC com polaridade invertida.

Fig. 29: Módulo da resposta em frequência do elemento vertical array.

Fig. 30: Fase da resposta em frequência do elemento vertical array.

Fig. 31: Análise wavelet do elemento vertical array, crossover original.


- 15 -

Fig. 32: Análise wavelet do elemento vertical array,

crossover de fase linear.

Fig. 33: Módulo da resposta em frequência do driver de compressão com corneta CD.

Fig. 34: Análise wavelet do driver de compressão com corneta CD.

Fig. 35: Resposta ao impulso, Quad ESL-63.

Fig. 36: Fase da resposta em frequência, Quad ESL-63.

Fig. 37: Análise wavelet, Quad ESL-63.


- 16 -

6.4. Alto-Falante Hi-Fi Eletrostático

Foi medida a IR de um alto-falante eletrostático Hi-Fi, Quad ESL-63 (Figura 35). A resposta do sistema é bem alinhada devido ao princípio de funcionamento do próprio sistema. Isso é confirmado pela resposta em fase praticamente plana (Figura 36) e pela análise wavelet (Figura 37). A partir dos 100 Hz o sistema se mostra praticamente isento de distorções temporais, com um decaimento uniforme, exceto por uma ressonância de alguns milissegundos em torno de 450 Hz.

7. Conclusão

A análise wavelet é um instrumento poderoso para a caracterização da resposta de sistemas eletroacústicos. A razão disso consiste na caracterização conjunta tempo-frequência que é capaz de realizar. Um mapa de cores simples e de fácil leitura contém toda a informação do comportamento do conjunto tempo-frequência do sistema.

Este instrumento pode fazer parte do cotidiano do projetista de sistemas eletroacústicos e/ou transdutores. A análise wavelet certamente não substituirá o gráfico da resposta em fase no alinhamento temporal do sistema ou o Cumulative Spectral Decay quando o decaimento da resposta precisa ser analisado. É, todavia, um instrumento precioso que pode ser utilizado em conjunto com técnicas consagradas, ajudando na interpretação das características altamente difíceis de compreender e manejar como a resposta em tempo e em fase de sistemas eletroacústicos.

Como desenvolvimento futuro, pretendemos pesquisar algoritmos de cálculo mais eficientes como sugerido em [15] e a integração da análise wavelet em uma ferramenta com diferentes distribuições tempo-frequência.

8. Agradecimentos

Gostaríamos de agradecer à Audiomatica pelo apoio neste trabalho e por haver aberto seu sistema de medição CLIO a este novo campo. Agradecemos também a Fabio Blasizzo pelas numerosas sugestões proveitosas.

9. Referências Bibliográficas

[1] M. Di Cola, M. T. Hadelich, D. Ponteggia, D. Saronni, “Linear Phase Crossover Filters Advantages in Concert Sound Reinforcement Systems: a practical approach”, Presented at the AES 121st Convention, San Francisco, CA, USA, 2006 October 5-8

[2] H. Møller, P. Minnaar, S. K. Olesen, F. Christensen, J. Plogsties, “On the Audibility of All-Pass Phase in Electroacoustical Transfer Functions”, J. Audio Eng. Soc., vol. 55, No. 3, pp. 115-134 (2007, March).

[3] D. B. Keele, “Time-Frequency Display of Electroacoustic Data Using Cycle-Octave Wavelet Transforms”, Presented at the AES 99th Convention, New York, NY, USA, 1995 October 6-9

[4] D. W. Gunness, W. R. Hoy, “A Spectrogram Display for Loudspeaker Transient Response”, Presented at the AES 119th Convention, New York, NY, USA, 2006 October 7-10

[5] S. J. Loutridis, “Decomposition of Impulse Responses Using Complex Wavelets”, J. Audio Eng. Soc., vol. 53, No. 9, pp. 796-811 (2005, Sept.).

[6] O. Rioul, M. Vetterli, “Wavelets and signal processing”, IEEE Signal Processing Magazine, vol. 8, no. 4, Oct. 1991, pp. 14-38

[7] A. Duncan, “The Analytic Impulse”, J. Audio Eng. Soc., vol. 36, pp. 315-327 (1988, May).

[8] CLIO Software - User’s Manual, Audiomatica,

http://www.audiomatica.com

[9] R. C. Heyser, “Loudspeaker Phase Characteristics an Time Delay Distortion, Parts I and II”, J. Audio Eng. Soc., vol. 17, No. 1, pp. 30-41 (1969, Jan.); vol. 17, No. 2, pp. 130-137 (1969 Apr.).

[10] J. D’Appolito, Testing Loudspeakers, Audio Amateur Press, 1998

[11] A. Lukin, J. Todd, “Adaptive Time-Frequency Resolution for Analysis and Processing of Audio”, Presented at the AES 120th Convention, Paris, France, 2006 May 20-23


- 17 -

[12] C. P. Janse, A. J. M. Kaizer, “Time-Frequency Distributions of Loudspeakers: The Application of the Wigner Distribution”, J. Audio Eng. Soc., vol. 31, No. 4, pp. 198-223 (1983, Apr.).

[13] A. Mertins, Signal Analysis: Wavelets, Time-Frequency Transforms and Applications, Wiley, 1999

[14] R. L. Allen, D. Mills, Signal Analysis: Time, Frequency, Scale, and Structure, Wiley-IEEE Press, 2004

[15] O. Rioul, P. Duhamel, “Fast Algorithms for Discrete and Continuous Wavelet Transforms”, IEEE Transactions on Information Theory, vol. 38, no. 2, Mar. 1992, pp. 569-586.

Technology

Wavelets portugues