Want to make creations as awesome as this one?

Transcript

Fecha 04/01/2021

Autor/a: Campos Bueno SaraCurso: 1º Bachillerato Tecnológico

Estadística Unidimensional

" En esta presentaci´ón se definiran los conceptos básicos de la estadística unidimensional, así como los gráficos más usados para representarlas y demás conceptos de este tema"

03. Frecuencias

Índice

07. Medidas de Posición Central

09. Medidas de Dispersión

08. Medidas de posición no central

06. Gráficos

05. Intervalos de Clase

04. Tablas Frecuencia

02. Tipos variables

01.Concept.Básicos

.01

info

La estadística es la ciencia que estudia conjuntos de datos numéricos para, a partir de ellos, crear inferencias basadas en el cálculo de probabilidades.

¿Qué es la estadística?

Conceptos Básicos

INFO

Definición

Es el conjunto de objetos en el que queremos hacer inferencia, es decir, del cual queremos recabar datos y derivar de estos unas conclusiones. La población en estadística puede abarcar cualquier tipo de naturaleza. Puede tener como centro de estudios la incidencia de enfermedades,la calidad de un determinado tipo de productos (donde la población serían los productos en sí) o incluso las veces que acierta un jugador de baloncesto en canasta, por ejemplo.

1.2

Población

INFO

Definición

También llamado unidad estadística. Se define como cada uno de los elementos que forman parte de la población, se podría decir que es el equivalente a la unidad dentro de un grupo.

Individuo

1.3

INFO

Definición

La muestra es el subconjunto o grupo más pequeño de la población al cual tenemos acceso. Es de esta porción de la cual extraemos realmente los datos de las mediciones que tomamos. Su función es ser representativa de la población completa y está formada por un grupo de individuos seleccionados.

1.4

Muestra

- Cualitativos: felicidad de clientes, color de ojos, estado civil, profesión, ...- Cuantitativos: peso, velocidad de un vehículo, temperatura regustrada.

Ejemplos

Definición

Se denomina característica a todo aquella cualidad de un individuo que pueda ser objetivo de estudio. Dicho aspecto de la población a su vez, puede tener variantes, dichas variantes de un mismo carácter se denominan modalidades. Un carácter será cualitativo (de cualidad) si sus modalidades no se pueden expresar con cifras; y serán cuantitativas si sí se pueden expresar.

1.5

Carácter Estadístico

INFO

La variable estadística es el conjunto de valores que se toman de una característica estadística cuantitativa. Hay de dos tipos:

Definición

Aquella que puede tomar como cifra todos los valores dentro de la recta real

Contínua

Utilizan valores enteros y no finitos.

Discreta

.02

Variables estadisticas

INFO

INFO

INFO

Definición

La frecuencia es una medida que se utiliza de manera que expresa la aparición de un elemento Xi en un conjunto de elementos (X₁, X₂, X₃, … , Xₙ). Esta frecuencia la representamos mediante tablas de distribuciones de frecuencias que se presentan organizadamente en el recuento de datos. Si los datos provienen de una variable cuantitativa o tiene muchas categorías, los datos suelen ser agrupados en clases o tipos.Cada clase, que tiene una amplitud constante, se representa por una marca de clase, que viene a ser el punto medio de la misma.

.03

Frecuencias

Definición

Frecuencia absoluta (ni ), de un valor de la variable Xi, es el número de veces que se repite dicho valor. O lo que es lo mismo, el número de veces que el valor Xi está en el conjunto (X₁, X₂, X₃, … , XN). Por lo tanto, se sabe que la suma de todos los valores de las frecuencias absolutas de todos los elementos que forman el conjunto, debe ser el total de sujetos N. Si tenemos k categorías, se cumple:

Frecuencia Absoluta

3.2

Hacemos un recuento de las veces que se repite cada nota y las colocamos en la tabla en orden. Como se puede observar, si sumamos todas las frecuencias absolutas, nos tiene que dar 30.

Tenemos las siguientes notas de clase de unos alumnos de matemáticas. Son en total 30 alumnos.

Ejemplo Frecuencia Absoluta

Definición

Tenemos que la frecuencia absoluta acumulada(Ni) de un valor Xi, es la suma de las frecuencias absolutas de los valores menores o iguales a Xi. Por lo tanto, la frecuencia absoluta acumulada del valor más alto del conjunto (o de la última clase, en caso de las variables cualitativas), que hemos nombrado como XN, es igual al número total de sujeto. Llamamos a la frecuencia absoluta Ni y se cumple que:

Frecuencia Absoluta Acumulada

3.3

Tenemos las nota de 20nalumnos en matemáticas: 1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 10.Ordenamos los valores y sacamos sus frecuencias absolutas (veces en las que se repiten). Hay que tener en cuenta que:Xi = variable aleatoria estadística (en este caso las notas de unos alumnos en matemáticas)fi = en este caso se ha llamado fi a la frecuencia absoluta, en lugar de ni, pero es lo mismoFi = es la frecuencia absoluta acumulada, en lugar de llamarla Ni, han puesto Fi.N = 20 (que es el número de valores que tenemos de las notas)

Ejemplo Frec. Absoluta Acumulada

INFO

Donde fi es la frecuencia relativa, N igual al conjunto de datos de (X₁, X₂, X₃, … , XN), o lo que es lo mismo: N = (n1 + n2 + n3 + , … , nx) y ni el total de valores igual a Xi. La frecuencia relativa siempre son valores comprendidos entre cero y uno, es decir, 0 ≤ fi ≤ 1 . También tenemos que la suma de todas las frecuencias relativas es igual a 1 y por tanto, la suma de un conjunto en el que tenemos k números (o categorías) diferentes es:

Definición

Frecuencia relativa ( fi ), de un valor variable Xi es el cociente entre la frecuencia absoluta del valor y el número total de datos. Dicho de otra manera, la frecuencia relativa es la proporción de valores iguales a Xi en el conjunto de datos (X₁, X₂, X₃, … , XN). Por lo tanto, se nos queda que:

3.4

Frecuencia Relativa

Tenemos 20 notas de alumnos de matemáticas, calculamos su porcentaje de frecuencia relativa a partir de los datos:1,2,8,5,8,3,8,5,6,10,5,7,9,4,10,2,7,6,5,10.Tenemos en cuenta que:Xi = variable aleatoria estadísticaN = 20fi = frecuencua absolutahi = frecuencia relativa (en porcentaje)

Ejemplo Frecuencia Relativa

INFO

En el caso del valor más bajo, X1, la frecuencia relativa acumulada y la frecuencia relativa, serán iguales. En los demás casos, la frecuencia relativa acumulada es mayor que la frecuencia relativa. También sabemos que la frecuencia acumulada de un valor Xi es la suma de las frecuencias relativas de los valores menores o iguales a él.

Definición

La frecuencia relativa acumulada (Fi). La frecuencia relativa acumulada de un valor Xi, es el cociente entre la frecuencia absoluta acumulada de dicho valor y el número total de datos; o lo que es lo mismo, es la proporción de valores iguales o menores a Xi en el conjunto de datos (X₁, X₂, X₃, … , XN). Por lo tanto, tenemos que se cumple:

3.5

Frecuencia relativa Acumulada

Volvemos con las notas de los alumnos de clase de matemáticas, siguen siendo 20.1,2,8,5,8,3,8,5,6,10,5,7,9,4,10,2,7,6,5,10. Calculamos la frecuencia relativa y su porcentaje, entonces, sumamos a la frecuencia absoluta, las frecuencias de los valores menores.Seguimos teniendo en cuenta que en este ejemplo:N = 20Xi= variable aleatoria estadísticafi= frecuencia absolutaHi= frecuencia relativa acumuladahi= frecuencia relativa

Ejemplo Frec. Relativa Acumulada

  1. Recogemos los datos de la muestra.
  2. Ordenamos los datos de manera creciente o decreciente.
  3. Recuento de frecuencias.
  4. Agrupamos los datos (si es necesario). En el caso de que la variable sea continua (donde los datos pueden estar en cualquier parte de la recta real) o en el caso de que fuese discreta, pero los valores obtenidos sean muy grandes, se puede considerar agrupar los datos en intervalos o clases, nombrandolos con la marca de clase (punto medio del intervalo). Los intervalos deben de estar hechos de manera que el mayor de uno coincida con el menor de otro. Así, por ejemplo, se obtendría el intervalo de [ 40 - 45) y el de [ 45 - 50 ). Cabe mencionar que todos los intervalos deben tener la misma amplitud

Tablas de Frecuencias

.04

1º columna: ordenamos de menor a mayor los valores que tiene la variable en el conjunto de datos. 2º columna y 3º columna: frecuencia absoluta y frecuencia absoluta acumuladas. 4º columna y 5º columna: frecuencia relativa y las frecuencias relativas acumuladas de cada valor. 6º columna y 7º columna: (OPCIONAL)frecuencia relativa y frecuencia relativa acumulada multiplicados por cien, para obtener así sus porcentajes.

info

Ejemplos Tablas de Frecuencias

“En una clase con 30 alumnos, hay 3 que no tienen hermanos, 9 con un hermano, 13 con dos hermanos, 2 con 3 hermanos, 1 con 4 hermanos, 1 con 5 hermanos y 1 con 8 hermanos. Elabora la tabla estadística de la variable “nº de hermanos. Hacemos una tabla de frecuencias con esos datos.”

Ejemplos Tablas de Frecuencias

La marca de clase, es el punto medio de cada intervalo, y va a ser el valor que represente a todo el intervalo cuando se necesite en algunos cálculos de parámetros.

INFO

Los intervalos de clase se utilizan en el caso de que nos encontremos con una variable continua o una relativa donde la cantidad de datos sea muy grande. Para hacer un intervalo de clase, se agrupan los valores en intervalos que tengan la misma amplitud. A cada clase, se le asigna su frecuencia correspondiente. Cada clase o intervalo, está delimitado por el límite inferior de la clase y el límite superior de la clase y la amplitud de dicha clase es la diferencia que hay entre el límite superior y el límite inferior.

Intervalos de Clase

.05

Subtítulo genial aquí

DatA

Se ha realizado un estudio sobre la altura de los alumnos de una clase de secundaria y se han obtenido los siguientes datos (en metros): 1, 66 - 1, 80 - 1, 66 - 1, 77 - 1, 85 - 1, 74 - 1, 84 - 1, 89 - 1, 72 - 1, 69 - 1, 89 - 1, 88 - 1, 72 - 1, 81 - 1, 70 Recoger todos los datos utilizando intervalos de amplitud 5 y realizar la tabla de frecuencias. Como todos los datos son mayores a 1,65 m empezaremos los intervalos con 1,65 m. La columna denominada Xi, contiene la marca de clase.

Ejemplo Intervalos de Clase

INFO

Definición

Un gráfico es una representación gráfica de los valores numéricos y datos obtenidos en la investigación, es decir, son una representación visual de una serie de datos estadísticos. Sus objetivos son:

  • Captar la atención del receptor.
  • Facilitar la comparación de datos
  • Destacar la tendencia y las diferencias
  • No debe inducir a error
  • Ilustrar la información de manera clara y precisa

.06

Gráficos

Definición

Suele ser usado en variables cuantitativas para ver su transcurso a lo largo del tiempo, pues su disposición permite observar los cambios de tendencias de los datos. Un diagrama lineal está formado por una serie de datos representados por puntos en un eje cartesiano que refleja la relación que existe entre dos variables y cómo fluctúan los valores entre ellas

Gráfico Lineal

6.2

Ejemplos Gráfico Lineal

Definición

Representa los datos sobre un eje de abcisas, en esos puntos, se levantan barras con altura proporcional a las frecuencias absolutas o a las frecuencias absolutas acumuladas. se utiliza con variables cualitativas o discretas y se forma de barras rectangulares cuya altura es proporcional a la frecuencia de cada uno de los valores de las variables. Las partes principales del diagrama de barras son:

  • Eje de abscisas: van las cualidades de la variable, si la variable es cualitativa, o los valores de dicha variable, si es discreta.
  • Eje de ordenadas: frecuencia relativa o absoluta con barras proporcionales.
  • Las barras tienen que tener todas el mismo ancho y no deben superponerse unas con otras.
  • Las barras pueden ser tanto verticales como horizontales.
  • Las barras pueden ir ordenadas por frecuencias o por orden alfabético.

6.3

Diagrama de barras

Ejemplos Diagrama de Barras

Porcentaje de habitantes usuarios de internet del año 2007 por países (Fuente: Unión Internacional de Telecomunicaciones).

Existen varios tipos de diagramas de barras, en función de cómo representan los datos:

  • Sencillo, donde solo hay una serie de datos.
  • Agrupado, hay varias series de datos que se representan con un mismo color.
  • Apilado, hay varias series de datos donde la barra se divide en segmentos de diferente color y cada uno de ellos representa una serie.

Definición

Son usados para representar las frecuencias de una variable cuantitativa contínua. Los datos son agrupados mediante intervalos. Los rectángulos representan la frecuencia absoluta de cada uno de los intervalos y a diferencia de los gráficos de barras, el histograma se distribuye de manera que los rectángulos se sucedan sin espacios y sin cortarse. En uno de los ejes se posicionan las clases de la variable continua (los intervalos o las marcas de clase que son los puntos medios de cada intervalo) y en el otro eje las frecuencias.

Histograma

6.4

Ejemplo Histograma

Definición

Si se unen los puntos medios de las bases superiores de las barras de un histograma, obtendremos un polígono de frecuencias. Los polígonos de frecuencias permiten la rápida visualización de las frecuencias de cada una de las categorías del estudio y pueden estar hechos mediante las frecuencias relativas, aunque es más común su uso con polígonos de frecuencias absolutas.

6.5

Polígono de Frecuencias

Ejemplo Polígono de Frecuencias

INFO

También es conocido como diagrama de pastel o diagrama circular. Es la representación gráfica a modo de círculo, de las frecuencias relativas de una variable cualitativa o discreta. Dicho círculo refleja la totalidad de lo que se quiere observar y se divide en tanto sectores como categorías de la variable estudiemos. Dicho sector es proporcional a dicha variable respecto al total, y en él se suele reflejar el porcentaje de dicha variable. Para obtener el ángulo de cada sector, se lleva a cabo los siguiente:

Diagrama de Sectores

6.6

Ejemplo Diagrama de Sectores

Las medidas de centralización o de posición central, son las medidas que tratan de localizar la parte central de un conjunto de datos ordenados de una variable cuantitativa. Aquí estudiaremos la mediana, la moda y la media o promedio.

.07

Medidas de Posición Central

INFO

Definición

También puede ser llamada promedio o media aritmética. Es el valor característico de una serie de datos (X1, X2, … , XN) resultado de la suma de todas las observaciones dividido por el número total de datos. Se calcula de la siguiente manera:

Media

7.2

INFO

Se representa como Me(x) y es el elemento de un conjunto de datos ordenados (X1, X2, … , XN) que deja a izquierda y a derecha la mitad de los valores. Es decir, la mediana es el número medio en el conjunto (después que los números han sido arreglados del menor al mayor). Si el número de elementos es par, la mediana es el promedio (la media) de los dos números medios. Si el conjunto de datos no está ordenado, la mediana es el valor del conjunto tal que el 50% de los elementos son menores o iguales y el otro 50% mayores o iguales.

7.3

Mediana

INFO

Se la representa como Mo(x) es el valor que más se repite dentro del conjunto de datos (X1, X2, … , XN) , o lo que es lo mismo, es el valor que tiene una frecuencia relativa mayor. Dentro de un mismo conjunto pueden existir más de una moda.

Moda

7.4

Promedio

  • Moda ---> x = (2,5,8,8,9,10) ---> Mo (x) = 8
  • Bimodal ---> x = ( 8,9,6,7,7,5,4,3,3,2) ---> Mo(x)= 3,7
  • Multimodal ---> x = (2,2,8,6,6,7,1,1,0,10,5,5) ---> Mo(x) = 1,2,6
  • Amodal ---> x = (1,2,3,4,5) ---> Mo(x) = ∄
  • Adyacente ---> x = (2,3,3,5,5,7,8) ---> Mo(x) = 4

7.8

Tipos de Moda

.08

- Cuartiles y Percentiles

En este trabajo estudiaremos

Medidas de Posición no central

Definición

Las medidas de posición no central, también llamadas medidas de tendencia no central nos dan medidas que no tienen necesariamente que ser centrales, sino que dividen el conjunto en grupos con el mísmo número de valores.

Definición

Los cuartiles son una medida que divide el conjunto ordenado de datos (X1, X2, … , XN) en cuatro partes iguales, dándote tres valores que son los puntos donde divide el conjunto. De esta manera, el primer cuartil deja a la izquierda el 25% de los valores, el segundo cuartil deja 50% tanto un lado como el otro (coincide con la mediana), el último cuartil deja 75% de los datos a la izquierda. De esta manera los cuartiles son:

8.2

Cuartiles

EJEMPLO

Tenemos un conjunto de 19 elementos, calculamos el primer cuartil con la fórmula: Q1 = X ((N + 1) / 4) Q1 = X ((19 + 1 ) / 4) Q1 = X (20 / 4) Q1 = X5 Con lo cual el cuartil queda como Q1 = X5

Calcular Cuartil sin decimales

8.3

El cuartil 3 quedaría como 52,75

Q3 = X (3* (N+1))/4 Q3 = X (3*(20+1))/4 Q3 =X(63/4) Q3= X15,75 Dado a que el número tiene decimales, el cuartil quedaría entre X15=52 y X16=53. Aplicamos entonces la fórmula mencionada:

Tenemos las edades ordenadas de los socios de un club. Intentemos calcular el tercer cuartil:

EJEMPLO

En el caso de que nos queden decimales, el cuartil quedaría como:

8.4

Calcular Cuartil con decimal

INFO

.09

Definición

También son llamadas medidas de variabilidad. Estas medidas nos tratan de dar un valor numérico mediante el cual podamos obtener información sobre la variabilidad de una variable estadística. Expresado con palabras más coloquiales, las medidas de dispersión son cifras que nos indican si se mueve mucho, poco, más o menos que otra.

Medidas de Dispersión

Definición

Se le llama rango o recorrido estadístico a la diferencia entre el valor máximo y el mínimo de un conjunto de valores.

9.2

Rango

Por lo tanto el rango de esta muestra, es decir, el rango de la edad de los jugadores es 13.

Tomamos entonces la edad del más mayor (máximo del conjunto), que es 31 y la del más joven (mínimo del conjunto), que es 19. Calculamos entonces de la siguiente manera:

Tenemos las edades de un equipo de fútbol (once jugadores) y queremos calcular su rango.

Ejemplo de Rango

Teniendo en cuenta que:

  • x̄ = es la media aritmética de los datos
  • (x1, x2, x3, …, xn) = son los datos
  • xi = cada uno de los datos
  • n = número de datos

Definición

Se calcula gracias a la desviación respecto a la media, que es la diferencia en valor absoluto entre cada valor de la variable y la media aritmética. La desviación media es, por lo tanto, la media de las desviaciones respecto a la media de todos los valores de un conjunto.

Desviación Media

9.3

Por lo tanto tenemos que la desviación media del conjunto de ejemplo es 4.25

Luego de eso calculamos la desviación media de la siguiente manera:

Primero calculamos su media, sumanddo los datos y dividiendo por el número de datos que tenemos:

Tenemos el siguiente conjunto de datos y queremos calcular su desviacion media:

Ejemplo Desviación Media

INFO

Definición

Se la denomina como S² y mide la dispersión de los datos de una muestra en referencia a la media y lo hace calculando la media de los cuadrados de las distancias de todos los datos.

9.4

Varianza (muestral)

Como se puede observar, calculamos también en la tabla las diferencias de los valores respecto a la media y la multiplización de los valores por el número de valores (para calcular la

Queremos calcular la varianza de un estudio sobre las alturas de niños de 10 años en una ciudad. Tenemos una muestra de 400 sujetos y realizamos una tabla de frecuencias donde colocamos las estaturas medidas en metros Xi y sus frecuencias ni.

Ejemplo Varianza (muestral)

Vemos como en el paso 1 conseguimos la media explicada con anterioridad y seguido de esto utilizamos los cálculos que hicimos en la tabla para conseguir la varianza (n metros cuadrados).Nos da que su valor es de 0,005 m² , esto quiere decir que, al ser una varianza tan pequeña, las muestras están muy agrupadas entorno a la media

Ejemplo Varianza (muestral)

INFO

Cuando hacemos las varianza sobre una población al completo, en vez de sobre una muestra, se representa con el símbolo σ² y su fórmula es la siguiente:

Varianza (poblacional)

9.5

Definición

La desviación media mide el promedio de las desviaciones de los datos respecto a la media en las mismas unidades de los datos. Es una medida de dispersión que está asociada a la media y que se calcula como la raíz cuadrada de la varianza. Por ende, siempre es positiva y solo es cero cuando todas las variables de la muestra son iguales. Cuando la obtengamos, podremos saber la concentración de los datos alrededor de la media. Cuanto menor sea su valor, mayor será dicha concentración.

9.6

Desviación Típica

Queremos determinar la desviación típica de las estaturas de 400 niños de una ciudad. Para ello rpimero ordenamos los daton en una tabla de frecuencias de la misma manera que cuando calculábamos la varianza.Colocamos las frecuencias de los datos, calculamos la columna de la diferencia de los datos respecto a la media, todo para hacer los últimos cálculos de la desviación.

Ejemplo Desviación Típica

Así pues, calculamos la media y gracias a ella podemos hacer la tabla de diferencias, que nos servirá para calcular la desviación típica de la siguiente manera:

Ejemplo Desviación Típica

Definición

El coeficiente de variación se representa con r y mide la dispersión respecto a la media sin tener en cuenta las unidades en las que están los datos. Se calcula dividiendo la variación de los datos entre el valor absoluto de la media. De esta manera, da un número entre 0 y 1. Si el valor del coeficiente de variación es cercano a cero, indica que la muestra es muy compacta. Si por el contrario, se acerca más a 1, sería una muestra dispersa.

9.7

Coeficiente de Variación de Pearson

A la hora de calcular el coeficiente de variación, necesitamos que nos den o clacular la media y la desviación típica. Este coeficiente nos ayuda a comparar la dispersión de una manera más eficiente entre variables. Por ejemplo, digamos que tenemos una población de rinocerontes cuyo peso es de 5.000 kg y su desviación típica de 400 kg. POr otra parte, tenemos una población de ardillas de un peso medio de 15 g y una desviación típica de 15 g.A primera vista pudiese parecer que la población de elefantes tiene una mayor dispersión respecto a la media, pero hagamos los cálculos del coeficiente.rinocerontes : 400 kg / 5000 kg = 0,08ardillas : 5g/15g = 0,33Como vemos ahora, podemos comprobar con certeza que los datos del peso de la `población de ardillas tiene más dispersión respecto a la media que la de rinocerontes.

Ejemplo Coeficiente de Variación

Sara Campos Bueno 1º Bach

Gracias porsu atención