Want to make creations as awesome as this one?

Transcript

Primera fase: Exposición de conceptos y contenidos retalivos a la estadística unidimensional.

Pablo Hormigo Jiménez 1º Bachillerato A

ESTADÍSTICA UNIDIMENSIONAL

Características

Se llama característica a cada uno de los aspectos que se desean estudiar en los individuos de la población. Cada característica puede tomar distintos valores.

Cuando la muestra y la población coinciden se dice que se ha realizado un censo.

Muestra

Individuo

Se llama individuo a cada uno de los elementos que conforman la población.

Se llama muestra o muestra representativa al subconjunto extraído de la población que represente bien todas sus características, para realizar el estudio estadístico cuyos resultados se extrapolan a toda la población.

Población

Se llama población al conjunto bien delimitado de elementos del que interesa observar o medir alguna característica, es decir, serán objeto del estudio estadístico.

Conceptos básicos

Los valores que una variable toma en cada elemento deberán ser exhaustivos e incompatibles. Es decir, la variable tomará un único valor por cada individuo de la población.

Variables estadísticas

Una variable estadística, X, representa una característica de la población que se va a estudiar. Para cada elemento de la población, la variable tomará un valor concreto x, que llamaremos dato. A el conjunto de valores que tome la variable en cada uno de los individuos de la muestra, lo llamaremos conjunto de valores.

Conceptos básicos

Dicha variable puede ser: -Cuantitativa: Son aquellas en las que a las observaciones se les puede dar un valor numérico, por tanto son medibles. ·Discreta: Si toma valores finitos o numerables (Aislados). ·Continua: Si la variable puede tomar teóricamente cualquier valor de un intervalo de la recta real. -Cualitativa: Son aquellas que se refieren a alguna característica que no se puede expresar numéricamente. A dichas características las llamaremos modalidades.

Tipos de Variables estadísticas

Conceptos básicos

Si se desease medir el número de personas que hay en las casas españolas, sería una variable estadística cuantitativa, y discreta, pues toma valores numéricos aislados.

En este ejemplo la población son las bacterias de la placa de petri. La muestra representativa es el conjunto de las 300 bacterias estudiadas y la característica que se estudia es si sobreviven o no a la acción del antibiótico. Esta es una variable estadística cualitativa, pues toma valores no numéricos.

Se desea estudiar el número de bacterias en una placa de petri que han muerto al aplicar sobre ellas un determinado antibiótico. Por ello se toman 300 de ellas y se comprueba qué porcentaje de bacterias murieron.

Ejemplo

Conceptos básicos

i=1

fi

= f1 + f2 + ... + fn = N

__

fi

hi =

-Al resultado de dividir fi de cada valor posible xi de la muestra por el número total de elementos N de la muestra, lo llamaremos frecuencia relativa de xi, y se escribe hi:

Obviamente, la suma total de las frecuencias absolutas fi de todos los xi debe ser igual al número total de elementos N de la muestra.

-Al número de veces que cada valor xi aparece en la muestra se le llama frecuencia absoluta de xi , y se escribe fi .

Si sobre una muestra de N elementos se observa una variable estadística X, que puede tomar los distintos valores diferentes x1, x2, x3,...,xn , se tiene:

Frecuencia y tipos

__________

f1 + f2 + ... + fn

__

fn

__

f2

__

f1

__

+ ... +

hi

i=1

= h1 + h2 + ... + hn =

Obviamente, la suma total de las frecuencias absolutas fi de todos los xi debe ser igual al número total de elementos N de la muestra.

Frecuencias y tipos

Para poder analizar los datos con más facilidad estos se organizan en una tabla de frecuencias como la siguiente:

Multiplicando la columna de frecuencias relativas, hi, por 100, se obtiene el porcentaje de cada modalidad de X.

Tabla de frecuencias en variables cuaLitativas

Ejemplo: Se analizan los resultados electorales de las elecciones de 2019 en España.

Frecuencias y tipos

Hi

__

Fi

__

Hn

__

Fn

Y obviamente,

Al resultado de dividir Fi de cada valor posible xi entre el número total de elementos N de la muestra lo llamamos frecuencia relativa acumulada, y se escribe Hi.

j=1

fj

= N

Fn =

j=1

fj

Fi = f1 + f2 + ... + fi =

Lueg0,

Se define la frecuencia absoluta acumulada de xi como el número de veces que aparece en la muestra un valor igual o menor a xi, y se escribe Fi. Así pues, tenemos:

Tabla de frecuencias en variables cuaNtitativas discretas

En las tablas de frecuencias de las variables cuantitativas discretas se suele incluir además otras 2 columnas, que corresponden con las frecuencias acumuladas:

Frecuencias y tipos

Multiplicando la columna de frecuencias relativas, hi, por 100, se obtiene el porcentaje de cada valor de X.

Tabla de frecuencias en variables cuantitativas discretas

Ejemplo: Se desea analizar el número de personas convivientes en los domicilios de Andalucía. Por tanto se hace un muestreo en 3.000 hogares de diferentes ciudades y barrios de la comunidad autónoma. Tras recopilar los datos y hacer recuento se tiene: En 797 de esos hogares tan solo residía una persona; en 1086 de ellos, tan solo 2; en 541 residían 3 personas; en 424 hogares residían un total de 4 personas y en 152 hogares residían 5 o más personas. Para organizar estos datos se hace una tabla de frecuencias:

Frecuencias y tipos

Tabla de frecuencias en variables cuaNtitativas continuas

Cuando la variable que se analiza es continua, o bien cuando siendo esta discreta, la variable toma demasiados valores (n>15), conviene agrupar los datos en una tabla de frecuencias agrupándolos por intervalos. Estos intervalos tendrán una longitud fija y se llamarán clases. Cada clase está delimitada por el límite inferior de la clase y el límite superior de clase.Para elaborar una tabla de frecuencias con intervalos se procedería de la siguiente forma: Se localizan los valores extremos (menor y mayor valor) a y b, y se halla su diferencia r=b-a . A r lo llamaremos recorrido. Se decide el número de intervalos que se quiere formar. El número de intervalos no debe ser menor que 6 ni mayor que 15.

Frecuencias y tipos

El punto medio de cada intervalo se llamará marca de clase, y representará a todo el intervalo para el cálculo de algunos parámetros.

Tabla de frecuencias en variables cuaNtitativas continuas

Se toma un intervalo r’ y se busca que este r’ tenga una amplitud ligeramente superior a r y sea múltiplo del número de intervalos que se desea establecer con objeto de que estos tengan una amplitud entera. (Por ejemplo, si deseamos 8 intervalos, y r= 94, r’ podría tener una amplitud de 96). La longitud de cada intervalo será igual al resultado de dividir la amplitud de r’ por el número de intervalos deseados. (En el ejemplo, 96/8 = 12).Se forman los intervalos teniendo en cuenta que el límite inferior pertenece al mismo pero que el límite superior queda fuera de él. Por tanto y para evitar confusiones, es conveniente que los límites de los intervalos no coincidan con ninguno de los datos. Para ello, los extremos de los intervalos suelen tener una cifra decimal más que los datos.

Frecuencias y tipos

[10,205-10,305) [10,305-10,405) [10,405-10,505) [10,505-10,605) [10,605-10,705) [10,705-10,805) [10,805-10,905)

[9,605-9,705) [9,705-9,805) [9,805-9,905) [9,905-10,005) [10,005-10,105) [10,105-,10,205)

Tabla de frecuencias en variables cuantitativas continuas

Ejemplo:Se miden los tiempos que 100 atletas tardan en recorrer los “100 metros lisos”.Como la variable es continua organizamos los datos por intervalos. La marca menor es 9,61s y la mayor es de 10,87s. Por tanto, el recorrido es r=10,87-9,61=1,26 . Decidimos formar 13 intervalos de 1,30/13=0,1 segundos de longitud. Para que los límites de los intervalos no coincidan con ninguno de los datos pondremos una cifra decimal más. Los intervalos quedarán de la siguiente forma:

Frecuencias y tipos

Tabla de frecuencias en variables cuantitativas continuas

Ejemplo:Escribimos en una tabla las frecuencias de cada intervalo y calculamos el resto de parámetros anteriormente descritos:

Frecuencias y tipos

Gráficos en figuras geométricas

Estos gráficos forman figuras geométricas y relacionan la frecuencia de una determinada modalidad con el área que ocupa en el gráfico. Los más conocidos son los diagramas de sectores.

Plasman la información sobre mapas, son los menos utilizados.

Cartogramas

Es el tipo de gráfico más básico. Se llama cartesiano en honor a René Descartes, matemático francés. Los gráficos cartesianos relacionan variables independientes en el eje de abcisas (eje x) con variables dependientes en el eje de ordenadas (eje y) en un sistema de ejes ortogonales que se cortan en un punto origen. Los tipos de gráficos que utilizan este esquema son los diagramas de barras, los de línea o los de dispersión.

Gráfico cartesiano

Para poder observar los resultados estadísticos con mayor rapidez y eficacia, los datos se suelen representar en gráficos estadísticos. La elección del tipo de gráfico en el que representaremos los datos dependerá del tipo de datos que haya. Hay 3 tipos de gráficos:

Tipos de gráficos

Siguiendo el ejemplo anterior de variable cualitativa:

·Diagrama de barras:En el diagrama de barras por cada valor de una variable se dibuja una línea vertical cuya longitud representa la frecuencia absoluta o relativa del valor.

REPRESENTACIÓN GRÁFICA DE VARIABLES CUALITATIVAS

Las variables cualitativas se suelen representar en gráficos de barras (cartesiano) o en gráficos de sectores (geométrico).

Representación gráfica de variables estadísticas

Representación gráfica de variables estadísticas

Frecuencia acumulada:

Frecuencia absoluta:

Representación gráfica de variables estadísticas

·Diagrama de sectores:En el diagrama de sectores un círculo se divide en secciones de ángulo proporcional a la frecuencia de cada valor. Se suelen incluir etiquetas en cada sector con el porcentaje de cada valor (hi · 100):

Siguiendo el ejemplo anterior de variable cuantitativa discreta:

Los datos de las variables cuantitativas discretas se representan con diagramas de barras, completandose estos con un polígono de frecuencias. Este último se dibuja uniendo los extremos de las barras.

Representación gráfica de variables cuantitativas discretas

Representación gráfica de variables estadísticas

Representación gráfica de variables estadísticas

Frecuencia acumulada:

Frecuencia absoluta:

Las variables cuantitativas de datos agrupados (continua o discreta con muchos datos) se suelen representar mediante histogramas de frecuencias absolutas o relativas.Un histograma es un tipo de gráfico cartesiano, relaciona una variable independiente que situaremos en el eje de abcisas (eje x) y una variable independiente que situaremos en el eje de ordenadas (eje y). Para elaborar un histograma situaremos los intervalos, que previamente hemos hecho en la tabla de frecuencias, en el eje de abscisas. Sobre cada uno de estos intervalos dibujamos un rectángulo cuya base sea la longitud del intervalo. Para que el área de cada rectángulo sea proporcional a la frecuencia de cada intervalo, la altura será el resultado de dividir la frecuencia entre la longitud del intervalo.

Representación gráfica de variables cuantitativas de datos agrupados

Representación gráfica de variables estadísticas

Además, los histogramas suelen ir acompañados con un polígono de frecuencias. Para elaborar un polígono de frecuencias en un histograma uniremos los puntos medios de las bases superiores de los rectángulos. También crearemos 2 nuevos intervalos en los extremos de longitud igual al resto, pero que tendrán una altura de 0.En caso de ser un histograma de frecuencias acumuladas, para elaborar el polígono de frecuencias se dibujaría en primer lugar la diagonal del primer rectángulo que se traza desde el extremo inferior izquierdo al superior derecho. Con los subsiguientes rectángulos se uniría el punto anterior con la esquina superior derecha del rectángulo en cuestión.

Representación gráfica de variables cuantitativas de datos agrupados

Representación gráfica de variables estadísticas

Representación gráfica de variables estadísticas

Siguiendo el ejemplo anterior de la variable cuantitativa continua:

Representación gráfica de variables estadísticas

Histograma de la frecuencia relativa:

Histograma de la frecuencia absoluta:

i=1

hi Xi

i=1

fi Xi

__

X =

En caso de estar los datos agrupados en clases xirepresenta la marca de clase. La media aritmética cambia demasiado con la inclusión de valores extremos, es por esto que muchas veces se recurre a otras medidas junto con la media, para tener una percepción más estable de la agrupación de los datos.

Se define la media aritmética muestral, x, o simplemente media muestral, de una variable estadística cuantitativa como el resultado de dividir la suma de todos los valores observados entre el número total de valores, es decir, el tamaño muestral.

Media aritmética muestral

Se definen las medidas de centralización como los valores de las variables que generalmente se sitúan en la zona central de la distribución de datos. Obviamente, estas medidas sólo tienen sentido en variables cuantitativas.

MEDIDAS DE CENTRALIZACIÓN

Medidas de centralización

Moda

Se define la moda Mo de una variable estadística cuantitativa discreta, como el valor xi que tiene mayor frecuencia absoluta fI.Se define la clase modal Mo de una variable estadística cuantitativa continua, como la clase que tiene mayor frecuencia por unidad de longitud. Si todas las clases tienen la misma longitud, entonces la clase modal será la clase con mayor frecuencia absoluta fi. La moda es una medida que carece de mucho valor práctico.

fh

__

___________

( - Fh-1) rh

M = Eh +

Medidas de centralización

Mediana

Se define la mediana M de una variable cuantitativa como el valor que divide a la muestra en dos mitades, para que la mitad de los xi sean inferiores a ella y la otra mitad sea superior. Después de ordenar de menor a mayor todas las observaciones de la muestra: si el tamaño muestral es impar, entonces la mediana será el valor central; si por el contrario es par, la mediana será cualquiera de los valores entre estos 2 valores centrales. Sin embargo, generalmente se considera la mediana como la media aritmética de estos últimos. Se define la clase mediana de una variable cuantitativa continua (o de datos agrupados) como la clase en la que se encuentra la mediana. Si los datos aparecen agrupados y se desea calcular la mediana, se suele realizar una interpolación lineal, suponiendo que los valores se distribuyen de manera uniforme en el intervalo (aunque esto no es necesariamente así). Así pues:

fh

__

___________

( - Fh-1) rh

M = Eh +

Medidas de centralización

Mediana

En donde xh es la clase mediana, por lo que:Eh es el extremo inferior de la clase mediana. Fh-1 es la frecuencia acumulada del intervalo anterior a la clase mediana. rh es la longitud de la clase mediana. fh es la frecuencia absoluta de la clase mediana.

Cuartiles:

Los cuartiles más utilizados son: los cuartiles y los percentiles.

Los cuartiles Q1, Q2 y Q3 dividen a la población en 4 partes iguales de manera que: Q1 es el cuantil de orden 0’25, es decir, el 25% de la población es inferior o igual a Q1; Q2 es el cuantil de orden 0’5, es decir, el 50% de la población es inferior o igual a Q2 = M; y Q3 es el cuantil de orden 0’75, luego el 75% de la población es menor o igual a Q3.

Medidas de centralización

Cuantiles

Se denomina cuantil de orden p, con 0<p<1. de una distribución de datos, como el valor cualquiera xp que marca un corte en la distribución de modo que una proporción p de los valores de la población son menores o iguales que xp y que una proporción (1-p) de los valores de la población son mayores a él.

_________

fh

(0'5N - Fh-1)rh

Para p=0,5(mediana) se verifica:

Nótese que ahora Eh ,Fh y los subsiguientes términos con subíndice h, representan ahora el límite inferior, la frecuencia absoluta… del intervalo en el que se encuentra el cuantil a calcular(y no solo la clase mediana).

_________

fh

(pN - Fh-1)rh

M = Eh +

Xp = Eh +

De forma análoga al cálculo de la mediana (cuantil de orden 0 '5), para el cálculo de cuartiles y percentiles (cuantiles en general) en variables cuantitativas continuas (o de datos agrupados) se hace una interpolación lineal.

Percentiles:

De forma análoga los percentiles dividen a la población en 100 partes iguales. (Los percentiles se denotan como P1,P2, ... y P99). Luego el percentil Pp (con p ∈ N y 0<k<100) es el cuantil de orden p/100. Es decir, el p% de los datos de la población serán menores o iguales que Pp.

Medidas de centralización

Medidas de centralización

Ejemplo de medidas de centralización en variables cuantitativas discretas

Se tiene la siguiente tabla de frecuencias:

675 + 1618 + ... + 4046 + 1232

______________________

i=1

fi Xi

9679

___

9679

4,253848538

i=1

fi Xi

__

X =

Media:

Medidas de centralización

Con la tabla de frecuencias dada, calculamos la media aritmética muestral de dicha distribución. Añadimos una segunda columna a la tabla de frecuencias, que represente el producto de cada valor posible xi y la frecuencia absoluta fi de dicho valor.

Moda:

Medidas de centralización

La moda sería en este caso el xi= 4

La mediana es 4.

Mediana y cuantiles:

Medidas de centralización

Cuando la frecuencia relativa acumulada Hi excede o iguala 0,5 (puesto que es el cuantil de orden p=0,5) sabremos que la mediana es xi. en este caso:

X =

Q1=3Q2=4 Q3=5

4,253848538

Mo=4M=4

Medidas de centralización

Para el cálculo de cuantiles en general de orden p, se busca en qué xi, el Hi correspondiente excede o iguala p. Por ejemplo, Q3 = 5, ya que H5 excede 0,75 (Q3 es el cuantil de orden 0,75). Se procede igual con los percentiles, por ejemplo P7=3 y P93=7. Así pues, tenemos que :

Medidas de centralización

Ejemplo de medidas de centralización en variables cuantitativas continuas

Se tiene la siguiente tabla de frecuencias con las alturas de 1.000 adultos:

La media es de 173,5 cm.

= 173,35 cm

0,008145+0,037155+...+0,013195+0,001205 =

X =

y que xi representa a la marca de clase. Por tanto, incluimos una nueva columna que contenga los productos de xihi.

i=1

hi Xi

X =

Media:

Medidas de centralización

Calculamos la media aritmética muestral de la distribución. Se sabe que:

Moda:

Medidas de centralización

Se observa que la clase con más frecuencia absoluta por unidad de longitud (todas tienen igual longitud) es el intervalo de [170-160). Así pues, tenemos que la clase modal Mo es [170-180).

Si queremos calcular el valor mediana, haremos una interpolación lineal, suponiendo que los casos se reparten linealmente por el intervalo.

_________

fh

(pN - Fh-1)rh

Xp = Eh +

Se observa que la clase en cuestión es la del intervalo [170-180).

Así pues, aplicamos la fórmula para el cuantil 0,5. Sabemos que:

Mediana y cuartiles:

Medidas de centralización

Para identificar la clase mediana (clase donde se encuentra la mediana, o cuantil de orden 0,5), buscaremos la primera clase cuya Hi exceda 0,5.

= 167.454545455 cm

________________

275

(0'25 · 1000 - 45) · 10

_________

fh

(pN - Fh-1)rh

Xp = Eh +

Q1 = X0'25 = 160 +

Así pues, procedemos a interpolar linealmente con la fórmula dada:

Identificamos el intervalo que contiene el cuartil Q1, en este caso, [160-170), pues la frecuencia relativa acumulada de dicho intervalo es la primera que excede p=0,25.

Para el cálculo del resto de cuartiles, pongamos el cuartil Q1 procedemos de forma análoga. Hallamos el intervalo o clase que contenga dicho cuartil (x0,25) y haremos una interpolación lineal en dicho intervalo. Con el ejemplo propuesto haríamos:

= 173.696098563 cm

_______________

487

(0'5 · 100 - 320) · 10

M = 170 +

Mediana y cuartiles:

Medidas de centralización

Como la mediana es el cuantil de orden 0,5, tenemos:

= 180.030425963 cm

________________

986

(0'81 · 1000 - 807) · 10

P81 = X81 = 180 +

= 178.829568789 cm

________________

487

(0'75 · 1000 - 320) · 10

Q3 = X0'75 = 170 +

Vamos a calcular también el percentil P81 a modo de ejemplo: Identificamos la clase que lo contiene, [180-190). Realizamos la interpolación:

De igual forma procedemos para el resto de cuartiles: Como ya hemos averiguado el cuartil Q2 (la mediana) calculamos el cuartil Q3. El intervalo cuya frecuencia relativa acumulada excede 0,75. Observamos que es el intervalo mediana [170-180) Así que realizamos la interpolación lineal:

Mediana y cuartiles:

Medidas de centralización

Gracias a estas medidas podemos observar que las alturas de las personas de la distribución se sitúan mayoritariamente en el intervalo [170-180), es más, sabemos que más del 50% de la población tiene una altura entre 167 cm y 179 cm (gracias a los cuartiles 1 y 3).

Q1 = 167.454545455 cm ≃ 167,45 cmQ2= 173.696098563 cm ≃ 173,70 cmQ3= 178.829568789 cm ≃ 178,83 cm

X =

173,35 cm

Mo= [170-180) cmM= 173.696098563 cm173,70 cm

Así pues, tenemos que :

Mediana y cuartiles:

Medidas de centralización

hi · d (xi,x)

i=1

____

____

hi

i=1

xi - x

_________

fi · d(xi,x)

i=1

Dx

Por lo laborioso de su cálculo, la desviación absoluta media no se suele calcular, y se utilizan más otras medidas de dispersión como la desviación típica o la varianza.

Desviación media

La desviación absoluta media, o simplemente la desviación media, de una distribución respecto de su media aritmética muestral x , Dx, es la media aritmética de las distancias entre cada uno de los valores x de la muestra X a x. Si los datos están agrupados en una tabla, hay que tener en cuenta que xi (cada valor posible de X) ha de multiplicarse por la frecuencia absoluta fi de cada valor posible, por lo que quedaría de la siguiente forma:

Las medidas de dispersión nos ayudan a medir lo dispersos que están los datos en una distribución con respecto a las medidas de centralización. Esto nos ayuda a evaluar si la característica estudiada es homogénea en la población.

Medidas de dispersión

- x 2

i=1

s2

La varianza se puede calcular de manera más simple mediante una fórmula que se extrae del desarrollo de la fórmula anterior. Esta fórmula quedaría así:

i=1

____

____

hi

i=1

xi - x

_________

fi · d(xi,x)2

i=1

hi (xi - x)

s2

hi xi 2

Varianza

La varianza, s2 , de una variable estadística, X, es la media aritmética del cuadrado de las distancias de cada valor muestral, xi, a la media aritmética muestral, x.

Medidas de dispersión

i=1

- x 2

_____________

hi xi 2

Desviación típica

Debido a que con el fin de obtener mejores propiedades algebraicas la varianza tiene unidades cuadráticas, calcularemos la raíz cuadrada positiva de la varianza y obtendremos la desviación típica.Se define la desviación típica, s, como la raíz cuadrada positiva de la varianza, es decir, la raíz cuadrada positiva de la media aritmética del cuadrado de las distancias de cada valor muestral xi a la media aritmética muestral x.

Medidas de dispersión

___

CV =

Coeficiente de variación

Para poder comparar la homogeneidad de varias distribuciones con datos de distinta dimensión, se utiliza el coeficiente de variación, ya que esta medida no se ve afectada por las dimensiones de una distribución de datos, pues es proporcional a la media de cada distribución.Se define el coeficiente de variación CV de una distribución de datos como el resultado de dividir la desviación típica por la media aritmética muestral de dicha distribución.

Medidas de dispersión

Ejemplo de cálculo de medidas de dispersión en variables cuantitativas discretas

Estudiemos la dispersión de la tabla anteriormente dada de variable cuantitativa discreta:

Medidas de dispersión

Por tanto: Dx ≃ 1,306088439 ≃ 1,306088

____

____

Y sabemos que x=4,253848538 ≃ 4,253849. Para facilitar su cálculo incluímos una columna que refleje el parámetro xi-x y otro que incluya este último parámetro multiplicado por la frecuencia relativa:

____

____

hi

i=1

xi - x

Dx

Desviación media:Si bien como he he explicado anteriormente esta medida no se suele calcular por lo costoso que resulta, la calcularé para que sirva de ejemplo:

Medidas de dispersión

- x 2

i=1

s2

hi xi 2

Añadiremos una columna que refleje el parámetro hixi2 de cada xi. Además calculamos el cuadrado de la media, que es: x2 = 4,253848538 2 = 18,0952273842 ≃ 18,095227

Varianza: Utilizamos la fórmula simplificada para el cálculo de la varianza:

Medidas de dispersión

≃ 1,63320880478 ≃ 1,633209

2'667371

_________

Desviación típica:Calculamos la raíz cuadrada positiva de la varianza:

Sustituímos: s2=20,762598 - 18,095227 = 2,667371 Nótese que s2 = 2,667371 en unidades cuadráticas.

= 20,7625981 ≃ 20,762598

i=1

hi xi 2

Varianza:Así pues, tenemos que x2 ≃ 18,095227 y que

Medidas de dispersión

Dx ≃ 1,306088 s2=2,667371 s ≃ 1,633209 CV ≃ 0.383937

Estos datos nos muestran que la distribución está relativamente concentrada en torno a la media aritmética muestral.

Así que tenemos:

≃ 0.38393675939 ≃ 0.383937

4,253849

_______

1,633209

CV =

___

CV =

Coeficiente de variación:Para poder comparar distribuciones con independencia de la magnitud de sus posibles xi, calculamos el coeficiente de variación:

Medidas de dispersión

Ejemplo de cálculo de medidas de dispersión en variables cuantitativas continuas

Estudiemos la dispersión de la tabla anteriormente dada de variable cuantitativa continua:

Medidas de dispersión

___

___

___

___

de igual forma que hemos procedido en el ejemplo anterior, añadimos una columna que refleje el parámetro xi-x y otra que refleje el parámetro hi xi-x de cada valor posible xi. Hay que tener en cuenta que xi representa a las marcas de clase.

Dx

i=1

____

____

hi

xi - x

Desviación media: Sabemos que la media aritmética muestral de la distribución es x=173,35

Medidas de dispersión

Así que tenemos que: Dx = 6,0249 cm

Desviación media:

Medidas de dispersión

s2

i=1

hi (xi - x)

Sustituímos :

= 74,7775 cm2

___

___

Añadiremos una columna que refleje el parámetro xi-x de cada xi (marca de clase). Además calculamos el cuadrado de dicho parámetro multiplicado por hi:

s2

i=1

hi (xi - x)

Utilizaremos la fórmula para el cálculo de la varianza:

Varianza:

Medidas de dispersión

Dx = 6,0249 cm

s2 = 74,7775 cm2 s ≃ 8,647398 cm CV ≃ 0,049315

Así pues tenemos que:

= 0,04931507271 ≃ 0,049315

175,35 cm

__________

8,647398 cm

CV =

___

CV =

Coeficiente de variación:Finalmente calculamos el coeficiente de variación, para poder comparar, por ejemplo con el ejemplo de variable cuantitativa discreta.

= 8.64739845271 cm ≃ 8,647398 cm

74,775 cm2

_________

Desviación típica: Calculamos la raíz cuadrada positiva de la varianza:

Medidas de dispersión

Podemos observar que pese a que la variación típica de la primera distribución es bastante menor que en la segunda (más de 5 veces menor), los coeficientes de variación de ambas son muy similares, esto quiere decir que, en proporción, ambas distribuciones se concentran en torno a la media.

( Dx ≃ 1,306088

s2 = 2,667371 s ≃ 1,633209CV ≃ 0.383937 )

Podemos observar que, como ya predijimos gracias a los parámetros de centralización, la distribución está muy concentrada entorno a los 175 cm de altura.Si comparamos los resultados con el ejemplo de variable cuantitativa discreta.

Medidas de dispersión

FIN DE LA PRESENTACIÓN