martes, 21 de julio de 2009

Estadística, probabilidad y ruido

Capítulo I

Estadística y probabilidad se utilizan en el procesamiento de señales digitales para caracterizar las señales y los procesos que las generan. Por ejemplo, un uso principal de la DSP es reducir la interferencia, el ruido, y otros componentes indeseables en los datos adquiridos. Estos pueden ser una parte inherente de la señal que se mide, surgen de las imperfecciones en el sistema de adquisición de datos, o se presentan como un subproducto inevitable de algunas operaciones DSP. Estadística y probabilidad permiten que estos elementos perturbadores sean medidos y clasificados, el primer paso en el desarrollo de estrategias para eliminar estos componentes indeseables. Este capítulo presenta los conceptos más importantes en estadística y probabilidad, con énfasis en la forma en que se aplican a las señales adquiridas.

Señales y terminología gráfica

Una señal es una descripción de cómo un parámetro está relacionado con otro parámetro. Por ejemplo, el tipo más común de señal analógica en electrónica es una tensión (voltaje) que varía con el tiempo. Dado que ambos parámetros pueden asumir un rango continuo de valores, vamos a llamar a esto una señal. En comparación, pasar esta señal a través de un convertidor analógico a digital fuerza a estos dos parámetros a ser cuantificados. Por ejemplo, imagina la transformación que se está realizando con 12 bits con una velocidad de muestreo de 1000 muestras por segundo. La tensión se reduce a 4096 (212) niveles binarios posibles, y el tiempo sólo está definido en incrementos de un milisegundo. Las señales que se forman a partir de parámetros que se cuantizaron de esta manera se dice que son señales discretas o señales digitalizadas. En su mayor parte, las señales continuas existen en la naturaleza, mientras que las señales discretas existen dentro de las computadoras (aunque se pueden encontrar excepciones a los dos casos). También es posible tener señales donde un parámetro es continuo y el otro es discreto. Dado que estas señales son muy poco frecuentes, no se han dado nombres especiales para ellas, y la naturaleza de los dos parámetros debe ser explícitamente indicado.

Figura 2-1 muestra dos señales discretas, y cómo pueden ser adquiridas con un sistema digital de adquisición de datos. El eje vertical puede representar el voltaje, intensidad de luz, presión de sonido, o un número infinito de otros parámetros. Dado que no sabemos lo que representa en este caso particular, vamos a darle la etiqueta genérica: amplitud. Este parámetro se llama también varios otros nombres: el eje-y, la variable dependiente, el rango, y la ordenada.

El eje horizontal representa el otro parámetro de la señal, pasando por nombres como: el eje "x", la variable independiente, el dominio, y el eje de abscisa. El tiempo es el parámetro más común para aparecer en el eje horizontal de las señales adquiridas, sin embargo, otros parámetros se utilizan en aplicaciones específicas. Por ejemplo, un geofísico puede adquirir mediciones de la densidad de la roca a distancias regulares a lo largo de la superficie de la tierra. Para mantener las cosas en general, nosotros simplemente utilizaremos la etiqueta de eje horizontal: número de muestras. Si esto fuera una señal, otra etiqueta tendría que ser utilizados, tales como: tiempo, distancia, x, etc.

Los dos parámetros que constituyen una señal por lo general no son intercambiables. El parámetro en el eje Y (la variable dependiente) se dice que es una función del parámetro sobre el eje "x" (la variable independiente). En otras palabras, la variable independiente describe cómo o cuando cada muestra es tomada, mientras que la variable dependiente es la medida actual. Dado un valor específico en el eje "x", siempre se puede encontrar el valor correspondiente en el eje Y, por lo general, pero no a la inversa.

Hay que prestar especial atención a la palabra: dominio, un término ampliamente utilizado en DSP. Por ejemplo, una señal de que utiliza el tiempo como la variable independiente (es decir, el parámetro sobre el eje horizontal), se dice que está en el dominio del tiempo. Otra señal en el DSP utiliza la frecuencia como la variable independiente, se dice que está en el dominio de la frecuencia. Del mismo modo, las señales que utilizan la distancia como parámetro independiente se dice que están en el dominio espacial (la distancia es una medida de espacio). El tipo de parámetro en el eje horizontal es el dominio de la señal, es así de simple. ¿Qué pasa si el eje "x" es la etiqueta con algo muy genérico, como el número de muestras? Los autores comúnmente se refieren a estas señales como en el dominio del tiempo. Esto se debe a que el muestreo a intervalos iguales de tiempo es la manera más común de obtener señales, y no tienen nada más específico para nombrarlas.

A pesar de que las señales en la Fig. 2-1 son discretas, se muestran en esta figura como líneas continuas. Esto se debe a que hay demasiadas muestras para que se puedan distinguirse, sí se muestran como marcadores individuales. En los gráficos que retratan las señales más corto, digamos de menos de 100 muestras, cada uno de los marcadores por lo general se muestran. Pueden haber líneas continuas conectando los marcadores, dependiendo de la forma en que el autor quiere que veas los datos. Por ejemplo, una línea continua podría implicar que algo está ocurriendo entre las muestras, o simplemente ser una ayuda para ayudar a que los ojos del lector siga una tendencia en los datos ruidosos. El punto es, examinar el etiquetado del eje horizontal para encontrar si estás trabajando con una señal continua o discreta. No confíe en la capacidad de un ilustrador para dibujar puntos.

La variable, N, se utiliza ampliamente en DSP para representar el número total de muestras en una señal. Por ejemplo, N = 512 de las señales en la Fig. 2-1. Para mantener organizados los datos, cada muestra se le asigna un número de muestra o índice. Estos son los números que aparecen a lo largo del eje horizontal. Dos anotaciones para la asignación de números de la muestra son de uso común. En la primera notación, la muestra índices corren a partir de 1 a N (por ejemplo, de 1 a 512). En la segunda notación, los índices de muestra van desde 0 a N - 1 (por ejemplo, de 0 a 511). Los matemáticos suelen utilizar el primer método (1 a N), mientras que los que comúnmente utilizan DSP usan el segundo (0 a N - 1). En este libro, vamos a utilizar la segunda notación. No descarte esto como un problema trivial. No se confunda usted en algún momento de su carrera.

Texto basado en: "The Scientist and Engineer's Guide to Digital Signal Processing"
Steve Smith

No hay comentarios:

Publicar un comentario