[Musix-usuarios] Re: Modelo de sinusoides más residuo, también llamado SMS (Spectral Modeling Synthesis)

Hernán Ordiales hordiales en gmail.com
Vie Jul 20 21:49:43 CEST 2007


envio un screenshot para que vean como queda armada la red (no creo
que alguien se ponga  a bajar la version del svn) y de paso es más
gráfico, aprovecho para aclarar que se puede armar con la última
versión del networkeditor que esta en musix (la 1.1), lo que esta en
el svn es la red ya armada... pero los componentes que la forman ya
estan disponibles desde hace tiempo

On 7/17/07, Hernán Ordiales <hordiales en gmail.com> wrote:
>
> Este post lo escribí hace un tiempo y creo que no lo mandé aca. Si alguien leyó el post introductorio a CLAM y le gustó la idea, es bueno que lean algo sobre SMS (que creo que no es muy conocido por el público en general) ya que muchas de las cosas que tiene se basan en este modelo.
>
> Un ejemplo práctico y el más fácil e intuitivo de entender que se me ocurre en este momento consiste en analizar con este modelo (en el sentido de descomponer en sinusoides y residuo) una señal de voz , luego aplicarle una ganancia al residuo y volver a sintetizar. Lo que se obtiene es una voz ronca o disfónica, como la de Basile para los argentinos :P o la de Luis Armstrong.
>
> Esta red se puede armar fácilmente con el NetworkEditor de CLAM, y de hecho ya esta disponible en la versión del svn (la subi yo mismo)
>
>
>
>    s
>
>
>
>
>    Modelo de sinusoides más residuo
> by hordia on May 21, 2007
>
>
> Es un modelo de análisis/síntesis para procesamiento espectral orientado a aplicaciones musicales y de audio. Se puede ver como una generalización de la STFT (transformada de tiempo corto) y los modelos sinusoidales. Básicamente añade flexibilidad a la  STFT manteniendo buena fidelidad de sonido y una representación eficiente.
>
> Este modelo también es conocido como SMS (   Spectral Modeling Synthesis) y como HILN en el contexto de    MPEG4.
>
> Básicamente esta modelado como la suma de un conjunto de sinusoides (los "sobretonos" estables armónicos o no, las componentes determinísticas del sonido) más el residuo de ruido (modelado como un  proceso estocástico) como dos componentes separadas:
>
>
>
> donde  y    son la amplitud y fase instantaneas de la  sinusoide respectivamente, y    es la componente de ruido en el tiempo .
>  La fase instantanea de la ecuación es:
>
>  El primer paso del análisis detecta los sobretonos presentes en el espectro y los representa con sinusoides que varian con el tiempo . Luego se le resta al sonido original las componentes sinusoidales para obtener el "residuo" (ver el diagrama de bloques).
>
> La señal residual es modelada como un proceso estocástico y se describe como    ruido blanco filtrado:
>
>
>
> donde  es   ruido blanco y  es la   respuesta al impulso de un filtro que varia con el tiempo evaluada en el instante   .
>
> El residuo comprende la energía debida a vibraciones no estacionarias y a cualquier otra componente energética de naturaleza no sinusoidal.
>
> Algunas áreas donde este modelo se puede aplicar:
>
> análisis
> compresión de sonido
> separación de fuentes de sonido
> acústica musical
> percepción musical
> Algunos links con más información sobre este modelo:
>
> Xavier Serra: "   Musical Sound Modeling With Sinusoids Plus Noise".
> Tesis de Xavier Amatriain: " Sinusoidal plus Residual Model"
> Libro    DAFX: Chapter 10 - Spectral Processing.
> CLAM SMSTools:    Introduction tutorial,  more details.
> Este tipo de cosas me hace acordar que tengo que postear sobre la tesis de Juan Vuletich : "Nuevas bases para el procesamiento de música en el dominio tiempo-frecuencia " (aca un paper sobre la misma idea) un enfoque diferente para este tipo de cosas ( wavelets) que pienso que merece (como mínimo) un post entero lo antes posible.
>
>
>
>
>
>
> --
> Hernán
>    http://h.ordia.com.ar
> GnuPG: 0xEE8A3FE9
>



-- 
Hernán
http://h.ordia.com.ar
GnuPG: 0xEE8A3FE9
------------ próxima parte ------------
Se ha borrado un mensaje que no está en formato texto plano...
Nombre     : hoarseness.png
Tipo       : image/png
Tamaño     : 31136 bytes
Descripción: no disponible
Url        : /pipermail/musix-usuarios/attachments/20070720/4001d6d5/hoarseness-0001.png


Más información sobre la lista de distribución Musix-usuarios