martes, 15 de septiembre de 2009

ACTIVIDAD EN CLASE

MEDIDAS DE DISPERSIÓN.........observaciones x/m
POBLACIONES. MUESTRAS. VARIANZA, DESVSTANDAR.
La desviación estándar o desviación típica (σ) es una medida de centralización o dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Junto a la varianza -con la que está estrechamente relacionada-, es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que representan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones.
La varianza representa la media aritmética de las desviaciones con respecto a la media que son elevadas al cuadrado. Si atendemos a la colección completa de datos (la población en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atención sólo a una muestra de la población, obtenemos en su lugar la varianza muestral.
COEFICIENTE DE ASIMETRIA:
Mide el grado de asimetría de la distribución con respecto a la media. Un valor positivo de este indicador significa que la distribución se encuentra sesgada hacia la izquierda (orientación positiva). Un resultado negativo significa que la distribución se sesga a la derecha.
La distribución se considera simétrica si el valor del coeficiente es cero.
Ancho de clase: es la diferencia numérica entre el límite superior e inferior de una clase de datos.

Asimetría: grado de distorsión de una distribución de frecuencias a partir de la simetría horizontal.

Clase mediana: clase entre datos agrupados que contiene la mediana.

Clase modal: clase entre datos agrupados que contiene la moda.

Clases: agrupación de datos.

Clases de extremo abierto: clases que tienen sólo un punto indicado de extremo, el límite superior o el límite inferior.

Coeficiente de asimetría de Pearson (SK o sk): medida de la forma de una curva de frecuencia, que relaciona la moda y la media con la desviación estándar.

Coeficiente de curtosis (K o k): medida de la forma de una curva de frecuencia que clasifica dichas curvas como platocúrticas, mesocúrticas o leptocúrticas.

Conjunto de datos: conjunto de observaciones sobre una o más características de interés, para una o más unidades elementales.

Cuartiles: valores de un conjunto ordenado de datos que dividen el total de observaciones en cuatro cuartos, cada uno de los cuales contiene .25 ( o sea 25%) de los valores observados.

Curtosis: grado de agudeza de la curva de frecuencia.
Curva de frecuencia: representación gráfica, por una curva suave, de una distribución de frecuencia absoluta o relativa de una variable cuantitativa continua.

Dato: una sola observación sobre una característica especificada de interés poseída por una unidad elemental.

Deciles: valores de un conjunto ordenado de datos que dividen el total de observaciones en diez partes , cada una de las cuales contiene .10 (o sea 10%) de los valores observados.

Desviación estándar: medida de dispersión de desviación promedio, igual a la raíz cuadrada de la varianza.

Desviación media absoluta (MAD): medida de dispersión de desviación promedio, obtenida al promediar valores absolutos de desviaciones de observaciones individuales de la media.

Distribución de frecuencias acumulativas: resumen tabular de un conjunto de datos que, para cada una de varias clases colectivamente exhaustivas y mutuamente exclusivas, muestra el número absoluto o proporción de observaciones que son menores o iguales a los límites superiores de las clases en cuestión, o que son mayores o iguales a sus límites inferiores.

Distribución de frecuencia bimodal: distribución de frecuencia en la que ocurren dos valores diferentes con la frecuencia más alta, o casi esa.

Distribución de frecuencia absoluta: resumen tabular de un conjunto de datos que muestra las frecuencias de clase absolutas, en cada una de las diversas clases colectivamente exhaustivas y mutuamente exclusivas.

Distribución de frecuencias multimodal: distribución de frecuencias en la que ocurren dos o más valores con la frecuencia más alta, o casi esa.

Distribución de frecuencias relativa: resumen tabular de un conjunto de datos que muestra las frecuencias de clases relativas en cada una de varias clases colectivamente exhaustivas y mutuamente exclusivas.

Estadística: rama de las matemáticas relacionada con facilitar la sabia toma de decisiones frente a la incertidumbre y que, por lo tanto, desarrolla y utiliza técnicas para la cuidadosa recolección, presentación efectiva y correcto análisis de información numérica.

Estadística analítica: rama de la disciplina relacionada con el desarrollo y uso de técnicas para analizar debidamente (o sacar inferencias) información numérica.
Estadística descriptiva: rama de la disciplina que se relaciona con el desarrollo y uso de técnicas para la cuidadosa recolección y efectiva presentación de la información numérica.

Estadístico: medida de resumen basada en datos muestrales.

Fractil: valor en un conjunto ordenado de datos bajo el cual se encuentra una proporción especificada de todos los valores.

Frecuencia de clase absoluta: número absoluto de observaciones que caen en una clase dada.

Frecuencia de clase acumulativa: suma de las frecuencias de clase para todas las clases, hasta e incluso la clase en cuestión, comenzando en cualquier extremo de la distribución de frecuencias.

Frecuencia de clase relativa: proporción de todas las observaciones que caen en una clase dada.

Histograma de frecuencia: representación gráfica, como una serie de rectángulos contiguos, de una distribución de frecuencia absoluta o relativa de una variable cuantitativa continua, en forma tal que las áreas de los rectángulos corresponden a las frecuencias que se describan.

Límite: medida de dispersión de distancia; es la diferencia entre la observación máxima y la mínima de un conjunto de datos no agrupados o entre el límite inferior de la clase más grande y el límite inferior de la clase más pequeña para datos agrupados.

Media aritmética: medida de tendencia central obtenida de datos no agrupados al sumar los valores observados y dividir su suma entre el número de observaciones.

Mediana: medida de tendencia central; valor de un grupo ordenado de datos, arriba y abajo del cual se pueden encontrar igual número de observaciones.

Medidas de dispersión: números que indican la dispersión o diseminación de observaciones; muestran la magnitud en que los valores individuales de un conjunto de datos difieren entre sí, y difieren de su ubicación central.

Medidas de forma: números que indican ya sea el grado de asimetría o el de agudeza de una distribución de frecuencia.

Muestra aleatoria: subconjunto de un sistema, o de una población relacionada, escogido por un proceso aleatorio que da a cada unidad del sistema o población relacionada una oportunidad positiva conocida de ser seleccionado.

Parámetro: medida de resumen basada en datos poblacionales.

Percentil: valor de un conjunto ordenado de datos bajo el cual se encuentra un porcentaje especificado de todos los valores.

Primer cuartil: el fracril .25 o 25° de un conjunto ordenado de datos bajo el que se encuantra una cuarta parte de todas las observaciones.

Proporción: número que describe la frecuencia de observaciones en una categoría particular como una fracción de todas las observaciones hechas.

Regla de Sturgess: regla arbitraria para determinar el número deseable de clases, k, de una distribución de frecuencia; dado un conjunto de datos de tamaño n, la regla sugiere k= 1 + 3.3 log n.

Regla empírica: "cuando una población estadística es descrita en forma más o menos precisa por la distribución de frecuencia normal, la media, la mediana y la moda probable coinciden en el centro de la distribución y los porcentajes pronosticables de todos los valores poblacionales se encuentran dentro de ± 1, ± 2, y ± 3 desviaciones estándar de la media. Estos porcentajes son aproximadamente iguales a 68, 95 y 100%."

Segundo cuartil: es el fractil .50 o el 50° percentil de un conjunto ordenado de datos, abajo del cual se encuentra la mitad de todas las observaciones; la mediana.
Teorema de chebyshev: teorema que indica lo siguiente: cualquiera que sea la forma de una distribución de frecuencia de población, la proporción de observaciones que caen dentro de k desviaciones estándar de la media es al menos 1 - ( 1/k2 ), dado que k sea 1 o más.

Tercer cuartil: el fractil .75 del 75° percentil de un conjunto ordenado de datos, abajo del cual se encuentran tres cuartas partes de todas las observaciones.

Varianza: medida de dispersión de una desviación promedio, obtenida al promediar los cuadrados de desviaciones de observaciones individuales a partir de la media.
La desviacion estandar siempre esta diciendo q a mañor desviacion estandar los datos son menos confiables.
El siguiente teorema, debido a Chebyshev da una estimación conservadora de la probabi8lidad de que una variable aleatoria tome un valor dentro de κ desviaciones estándar de su media para cualquier numero real κ proporcionaremos la demostración solo para el caso continuo y se deja el caso discreto como ejercicio.
Teorema de Chebyshev: La probabilidad de que cualquier variable aleatoria X, tome un valor dentro de la κ desviaciones estándar de la media es al menos 1 – 1 / κ2. Es decir
P (µ - κ σ <>

No hay comentarios:

Publicar un comentario