jueves, 23 de julio de 2009

Señales vs procesos subyacentes

Capítulo I

La estadística es la ciencia de la interpretación de los datos numéricos, como las señales adquiridas. En comparación, la probabilidad se usa en DSP para comprender los procesos que generan señales.

A pesar de que están estrechamente relacionadas, la distinción entre la señal adquirida y el proceso subyacente es la clave para muchas técnicas de DSP.

Por ejemplo, imagina crear una señal de 1000 puntos tirando una moneda 1000 veces. Si la moneda cae cara, a la correspondiente muestra se le da el valor de uno. Sí sale cruz, la muestra se fija en cero. El proceso que crea esta señal tiene una media de 0,5 exactamente, determinada por la probabilidad relativa de cada uno de los posibles resultados: 50% caras, el 50% cruces. Sin embargo, es poco probable que el real (actual) punto 1000 de la señal tenga una media de 0,5 exactamente. El cambio aleatorio hará el número de unos y ceros ligeramente diferente cada vez que la señal se genera. Las probabilidades del proceso subyacente son constantes, pero las estadísticas de la señal adquirida cambian cada vez que se repite el experimento. Esta irregularidad aleatoria observada en los datos reales es llamada con nombres tales como: la variación estadística, fluctuación estadística, y el ruido estadístico.

Esto presenta un dilema. Cuando veas los términos: media y desviación estándar, ¿cómo saber si el autor se refiere a las estadísticas de una señal real, o las probabilidades del proceso subyacente que creó la señal? Lamentablemente, la única cosa que te puede decir es el contexto. No es el caso para todos los términos utilizados en la estadística y la probabilidad. Por ejemplo, el histograma y la función de probabilidad de masa (que se examinan en la siguiente sección) los conceptos concordantes que tienen nombres por separado.

Ahora, de vuelta a la Eq. 2-2, el cálculo de la desviación estándar. Como se mencionó anteriormente, esta ecuación divide por N-1 en el cálculo de la media de las desviaciones al cuadrado, en lugar de simplemente por N. Para entender por qué esto es así, imagine que usted desea encontrar el promedio y la desviación estándar de un proceso que genera las señales. Con este fin, haya adquirieres una señal de N muestras del proceso, y calculas la media de la señal a través de Eq. 2,1. A continuación, puedes utilizar esto como una estimación de la media del proceso subyacente, sin embargo, usted sabe que habrá un error debido al ruido estadístico. En particular, para las señales aleatorias, el error típico de la media de los N puntos, y la media del proceso subyacente, está dado por:



Si N es pequeño, el ruido estadístico en la media calculada será muy grande. En otras palabras, no tienes acceso a los suficientes datos para caracterizar adecuadamente el proceso. Cuanto mayor sea el valor de N, menor será el error . Un hito en la teoría de la probabilidad, la Ley Fuerte de los números grandes (Strong Law of Large Numbers), garantiza que el error se convierte en cero cuando N se acerca a infinito.

En el siguiente paso, queremos calcular la desviación estándar de la señal adquirida, y lo utilizas como una estimación de la desviación estándar del proceso subyacente. En ello radica el problema. Antes de poder calcular la desviación estándar utilizando la Eq. 2-2, es necesario que conozcas ya la media, μ. Sin embargo, no sabes la media del proceso subyacente sólo la media de los N puntos de la señal, la cual contiene un error debido al ruido estadístico.

Este error tiende a reducir el valor calculado de la desviación estándar. Para compensar esto, N se sustituye por N-1. Si N es grande, la diferencia no es importante. Si N es pequeño, esta sustitución proporciona una estimación más precisa de la desviación estándar del proceso subyacente. En otras palabras, la Eq. 2-2 es una estimación de la desviación estándar del proceso subyacente. Si dividimos por N en la ecuación, proporcionará la desviación estándar de la señal adquirida.



Como ejemplo de estas ideas, mira las señales en la Fig. 2-3, y pregúntate: ¿son los las variaciones en estas señales resultado del ruido estadístico, o es la evolución del proceso subyacente? Probablemente no es difícil convencerte de que estos cambios son demasiado grandes para que se deban al azar, y que deben estar relacionados con el proceso subyacente. Los procesos de cambian sus características de esta manera se denominan no estacionarios. En comparación, las señales previamente presentadas en la Fig. 2-1 se generan de un proceso estacionario, y las variaciones resultan completamente del ruido estadístico. La Figura 2-3b ilustra un problema común con señales no estacionarias: el cambio lento de la media interfiere con el cálculo de la desviación estándar. En este ejemplo, la desviación típica (estándar) de la señal, en un corto intervalo de tiempo, es de uno. Sin embargo, la desviación estándar de toda la señal es 1.16. Este error puede ser casi eliminado rompiendo la señal en secciones cortas, y calculando la estadística de cada una de las secciones por separado. Si es necesario, la desviación estándar para cada una de las secciones se puede promediar para conseguir un solo valor.

No hay comentarios:

Publicar un comentario