Estadística descriptiva
osmoreno1039
Created on February 27, 2019
More creations to inspire you
SPRING HAS SPRUNG!
Presentation
THE OCEAN'S DEPTHS
Presentation
2021 TRENDING COLORS
Presentation
POLITICAL POLARIZATION
Presentation
VACCINES & IMMUNITY
Presentation
LETTERING PRESENTATION
Presentation
ARTICLES
Presentation
Transcript
ESTADÍSTICADESCRIPTIVA
Medidas de centralización
Medidas de posición
Medidas de dispersión
Medidas de correlación
Media aritméticao ponderada
Mediana
Moda
Cuartiles
Deciles
Centiles
Covarianza
Coeficiente de correlación de Pearson
Amplitud total
Desviación media
Desviación típicay varianza
Otros coeficientede correlación
La media aritmética es la suma de todos los datos dividida entre el número total de datos. La media ponderada es la suma de todos los datos, cada uno de ellos multiplicado por un factor (peso), de forma que todos los pesos suman 1.
La mediana es el valor que se sitúa justo en la mitad de un conjunto de datos ordenados de mayor a menor. La mitad de los datos del conjunto son mayores que la mediana y la otra mitad son menores.
La moda es el valor más repetido en un conjunto de datos. Puede haber más de una moda.
Los cuartiles son valores que dividen un conjunto de datos ordenados de mayor a menor en cuatro partes iguales. El primer cuartil (Q1) tiene el 25% de los datos por encima de él, el segundo cuartil (Q2) tiene el 50% de los datos por encima de él, y el tercer cuartil (Q3) tiene el 75% de los datos por encima de él.
Los deciles son valores que dividen un conjunto de datos ordenados de mayor a menor en diez partes iguales. El primer decil (D1) tiene el 10% de los datos por encima de él, el segundo decil (D2) tiene el 20% de los datos por encima de él, y así sucesivamente.
Los centiles son valores que dividen un conjunto de datos ordenados de mayor a menor en cien partes iguales. El primer centil (c1) tiene el 1% de los datos por encima de él, el segundo centil (c2) tiene el 2% de los datos por encima de él, y así sucesivamente.
La covarianza expresa la dispersión conjunta de los valores de dos variables. Para cada pareja de datos (uno de cada variable), se calcula la diferencia de cada valor respecto a su media aritmética, se multiplican esas diferencias entre sí, se suman para todas las parejas de datos y se divide entre el número de parejas.
El coeficiente de correlación de Pearson entre dos variables continuas es la covarianza entre esas dos variables dividida entre la desviación típica de cada una de ellas.
La amplitud total es la diferencia entre el valor más alto y el valor más bajo de un conjunto, es decir, indica el rango en el que se extienden los valores.
La desviación media es la suma de todas las diferencias (tomadas positivas) entre cada dato del conjunto y la media aritmética , dividido entre el número de datos.
Para obtener la varianza se calculan todas las diferencias entre cada dato y la media aritmética del conjunto, se elevan al cuadrado, se suman todas y se divide el resultado entre el número de datos. La desviación típica o estándar es la raíz cuadrada de la varianza.
Otros coeficientes de correlación lineal se aplican cuando una o las dos variables toman dos valores categóricos.
Expresan el valor en torno al cual se sitúan los datos de un conjunto.
Las medidas de posición, particularmente los cuantiles, dividen un conjunto de datos ordenados de mayor a menor en grupos con el mismo número de datos cada uno. Permiten establecer qué proporción de datos se encuentran por encima y por debajo del cuantil.
Las medidas de dispersión o variabilidad expresan cómo se distribuyen los datos en torno a alguna de las medidas de centralización.
Las medidas de correlación expresan la posible variación conjunta de dos variables, es decir, el grado en que los valores de una variable aumentan o disminuyen conforme aumentan o disminuyen los de la otra.