Want to make creations as awesome as this one?

Transcript

Instrucciones

Comenzar

Distribución de frecuencias para crear gráficos e histogramas

Revisemos cada uno de los puntos que componen este contenido.

Haz clic en las palabras resaltadas y en los íconos marcados a lo largo de la lectura para conocer la información oculta.

Hasta el momento, conoces cómo obtener una base de datos con la información de una situación de interés. Pero, ¿cuál es el siguiente paso para lograr que dicha información te sea de utilidad? La mejor metodología de análisis es comenzar por realizar un análisis univariado. Dependiendo del tipo de variables a analizar (categórica o cuantitativa), existe una serie de métodos tabulares y gráficos adecuados, tal como puedes ver en el siguiente diagrama.

1/35

Lorem ipsum dolor sit amet, lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.

Es decir, estudiar cada una de las variables involucradas por separado, y así conocer sus características más importantes.

Anderson. (2019). Estadística para negocios y economía. CENGAGE. Para analizar las variables de forma que la información sea de utilidad el primer paso sugerido es que trates de resumirla, para entender su comportamiento, por lo que construir una distribución de frecuencias es lo adecuado. Veamos cómo hacerlo.

Haz clic para ver imagen completa

Se trata de un resumen tabular de datos que muestra el número de elementos existentes en cada una de las categorías. Cada una de esas categorías son subconjuntos en los cuales se agrupan los datos mediante intervalos de una misma naturaleza, o de una misma amplitud. Las clases que conforman la distribución de frecuencia no se superponen (son mutuamente excluyentes entre sí), y se distribuye el número total de observaciones a cada clase a la que pertenece. La cantidad de datos en cada categoría es conocida como frecuencia absoluta, y también puede ser representada como una fracción del total, en ese caso se conoce como frecuencia relativa.

Distribución de frecuencias

2/35

Lorem ipsum dolor sit amet, lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.

Se aplica al caso de las variables categóricas.

Se aplica al caso de las variables cuantitativas.

Esta frecuencia también puede ser expresada en términos porcentuales al multiplicar la frecuencia relativa por 100.

Ejemplo de distribución de frecuencias para datos categóricos

Todas las variables categóricas son variables discretas. Los datos discretos pueden tomar sólo un número limitado de valores o respuestas. El número de clases dependerá de la cantidad de respuestas de la variable bajo estudio. En un hospital se le preguntó a 36 pacientes de una enfermedad específica: “¿qué grado de malestar está experimentando?”, y se les dio como opciones: Ninguno, Ligero, Moderado o Severo. Las respuestas obtenidas fueron:

3/35

Para elaborar una distribución de frecuencias con estos datos, se cuenta el número de veces que aparece cada respuesta posible. De esta manera, si organizamos las respuestas por orden alfabético, tendríamos el siguiente resultado:

Haz clic para ver imagen completa

Ahora bien, sabemos que el grado de dolor tiene una secuencia de intensidad. Debido a esto, una segunda opción de organización de los datos sería ordenarlos por dicha secuencia de intensidad, de manera que sea de más fácil análisis para los investigadores. El resultado sería el siguiente:

Recuerda que uno de los objetivos es identificar patrones en la información , por lo que en este caso, resaltamos que la intensidad moderada fue la de mayor presencia con un 36% de las respuestas.

4/35

Cuando se tiene un número considerable de clases, algunas pueden presentar un número pequeño de frecuencia. Se recomienda que dichas clases con frecuencias menores se agrupen en una clase agregada llamada “otros”. Las que presentan frecuencias de 5% o menos, se tratan de esta manera.

Haz clic para ver imagen completa

Dentro de las variables cuantitativas, pueden existir variables discretas y continuas. En estas variables se reconoce una variable discreta al ser el resultado de un conteo donde las respuestas posibles son únicamente enteras, por ejemplo el número de niños de cada familia . El número de clases dependerá de la cantidad de datos.

Ejemplo de distribución de frecuencias para datos discretos

5/35

Te podrás encontrar que, en situaciones como la del número de hijos por familia, la mayoría de las respuestas estará en un rango de 0 a 6. Sin embargo, habrá algunas pocas respuestas en las que el número sea mayor a 6. Esto lo podrás resolver utilizando una clase adicional de “7 ó más”. No es necesario continuar con la secuencia numérica de las clases (7, 8, 9…) para clases que no tuvieron observaciones.

En general, una distribución de frecuencias debe tener al menos 5 clases, y no más de 15. Si hay pocas clases se pierde información relevante, y si hay demasiadas los datos no han sido suficientemente resumidos.

Revisemos un ejemplo

Un periodista deportivo desea hacer un análisis sobre el comportamiento de las edades de los jugadores de la selección mexicana de fútbol. Para esto, obtiene la siguiente información del portal español Transfermarkt relacionada a la edad de cada uno de los integrantes de la plantilla de seleccionados mexicanos del 2023.

6/35

Veamos cómo realizar la distribución correspondiente.

Haz clic para ver imagen completa

Debido a que la cantidad de edades distintas no rebasa el máximo de 15 clases recomendadas, es posible hacer clases individuales que muestren la frecuencia de cada una de ellas comenzando con la menor. Antes de contar las ocurrencias de cada una de las posibles edades, pudiera serte de utilidad ordenar la tabla por edad de manera ascendente:

7/35

Haz clic para ver imagen completa

Ahora sí, a continuación realizas el conteo de ocurrencias de cada una de las edades posibles, y lo registras en su clase correspondiente. El resultado sería el siguiente:

8/35

La distribución resultante se puede considerar como distribución uniforme, es decir, la mayoría de sus clases presentan la misma frecuencia.

Haz clic para ver imagen completa

Podrás observar que las edades 21, 23, 24, 25 y 26 muestran la misma frecuencia (cantidad de jugadores). Por otro lado, a pesar de que ningún jugador tiene la edad de 29 años, se incluyó la clase de dicha edad. Esto se debe a que es importante mantener la secuencia, que es conocida como la amplitud de clase.

¿Qué pasa si requieres identificar una edad predominante? Una alternativa posible, dado que se tiene suficiente número de clases, sería agrupar distintas edades de la siguiente manera:

9/35

A pesar de que en términos absolutos hay sólo una diferencia de un jugador entre las clases 24-25 y la de 20-21, en términos porcentuales la diferencia es de 5.6%. Las expresiones en términos porcentuales, serán de gran ayuda al hacer comparaciones con las selecciones de otros países que pudieran tener una diferente cantidad de jugadores. Como viste, no existe sólo una forma de organizar los datos. Dependerá del objetivo a alcanzar y de la naturaleza de la información, la forma de agrupar y comunicar los resultados.

Haz clic para ver imagen completa

Ejemplo de distribución de frecuencias para datos continuos

En las variables cuantitativas, los datos continuos pueden tomar cualquier valor dentro de un contínuo (intervalo), y suelen ser el resultado de mediciones precisas (no de conteos) hechas con instrumento de medición, por ejemplo el tiempo en la línea del súper o los kilómetros recorridos de tu casa a tu oficina.Para crear una frecuencia de distribución útil debes considerar cuántas clases debes utilizar con tus datos, así como determinar la amplitud del intervalo de cada una de ellas. Los pasos para construir una distribución de frecuencias para datos continuos son:

1

2

3

10/35

Para determinar el número de clases cuando desconoces la forma en la que requieres estructurar la información, se puede utilizar la raíz cuadrada del número de datos (√n) como número de clases a utilizar.

Para determinar la amplitud del intervalo de cada clase de debe restar el valor menor del valor mayor (max-min), y dividirlo entre el número de clases a utilizar. Es importante que las clases tengan la misma amplitud para que puedas representarlas gráficamente y sean comparables las clases a través de sus frecuencias. Amplitud de clase= (Max-Min)/√n

Iniciando con el valor mínimo del conjunto de datos, sumar la amplitud de clase para calcular el límite superior de dicha clase. La segunda clase iniciará con el límite superior de la primera clase, a la cual se le suma la amplitud de clase para calcular su correspondiente límite superior. Este proceso se repite hasta completar el número de clases previamente definido.

Es necesario tener presente que la cantidad de clases recomendada es de 5 a 15. Esto se debe a que muy pocas, o demasiadas clases, puede proporcionar información no relevante para el estudio en cuestión.

Un restaurante quiere analizar el comportamiento de los montos (en dólares) de los tickets de un día de operaciones en año nuevo. Para ello, recolecta la información de los 50 tickets emitidos ese día y se tabulan en la siguiente tabla:

Aplicar los pasos

11/35

Haz clic para ver imagen completa

Con esta información, el restaurante comienza la construcción de la distribución de frecuencias de los montos de los tickets. Para ello, lo primero que debe hacer es seguir los pasos para obtener las clases: 1. Determinar el número de clases a utilizar: Como n=50, entonces el número de clases es √50=7.071 ≈ 7 clases. 2. Determinar la amplitud de cada clase: Como MAX=73,MIN=10 y número de clases =7, se tiene que: Amplitud de clase = (73-10)/7=93. Definir los intervalos a utilizar en cada clase:

12/35

Como ves, el límite superior de cada clase coincide con el límite inferior de la siguiente clase. Sin embargo, en la primera clase el 10 es el número menor del conjunto total de datos. Esto implica que la primera clase inició con el límite inferior del conjunto de datos. Para dar consistencia al resto de las clases, todas las siguientes clases deberán incluir en su rango al límite inferior. De tal manera que si tiene una edad de 37 años, deberá ser colocada en la cuarta clase y no en la tercera.

13/35

Como ves, el límite superior de cada clase coincide con el límite inferior de la siguiente clase. Sin embargo, en la primera clase el 10 es el número menor del conjunto total de datos. Esto implica que la primera clase inició con el límite inferior del conjunto de datos. Para dar consistencia al resto de las clases, todas las siguientes clases deberán incluir en su rango al límite inferior. De tal manera que si tiene una edad de 37 años, deberá ser colocada en la cuarta clase y no en la tercera.

Por otro lado, el número mayor del conjunto total de datos es 73. Dado que no tienes una octava clase, esta deberá incluirse en la última clase disponible. Los valores apropiados para los límites de clase con datos cuantitativos continuos dependen del nivel de precisión de estos.

14/35

Una alternativa a esto sería aumentarle una unidad al 73, es decir, calcular la amplitud de clase restándole 10 a 74, y teniendo una amplitud de clase de 9.1. Esto llevará a tener fracciones en los límites, pero cubrirá por completo el rango de valores. Recuerda que es importante ser práctico en la toma de decisiones, y que deberás reflexionar si este cambio en realidad te agrega valor.

Una vez determinadas las clases, lo siguiente es asignar y contabilizar cada dato en su clase correspondiente.

15/35

Una vez obtenida la distribución de frecuencia, es necesario el cálculo del punto medio de clase. Este valor será útil para la elaboración de gráficos y el cálculo de medidas estadísticas. Para calcularlo sumas el límite inferior y superior de cada clase, y lo divides entre 2. Por ejemplo, para la primera clase se suma 10 + 19, dividido entre 2, teniendo como resultado 14.5. Notarás además, que la diferencia entre una marca de clase y la clase siguiente equivale a la amplitud del intervalo.

16/35

Haz clic para ver imagen completa

También nombrada marca de clase, la cual es el punto medio representativo de cada clase o intervalo.

Al dividir cada frecuencia absoluta entre el total de datos, obtienes su correspondiente distribución de frecuencia relativa, es decir, expresada como fracción y como porcentaje:

17/35

Haz clic para ver imagen completa

En algunos casos es útil agregar otro resumen tabular de los datos, como lo es la frecuencia acumulada. La frecuencia acumulada es la suma de las frecuencias de todas las clases con los valores de datos menores o iguales que el límite superior de dicha clase. La tabla resultante quedaría de la siguiente manera:Al dividir cada frecuencia absoluta entre el total de datos, obtienes su correspondiente distribución de frecuencia relativa, es decir, expresada como fracción y como porcentaje:

18/35

Haz clic para ver imagen completa

Es importante resaltar que la última clase de una distribución de frecuencia acumulada siempre tendrá como frecuencia el total de datos utilizados (n). Por otro lado, en una distribución de frecuencia relativa acumulada, la frecuencia de la última clase siempre es igual a 100% o a 1.

¿Qué puedes observar en la tabla de distribución de frecuencias?

  • De los 50 tickets registrados, el porcentaje mayor, es decir el 22%, se encuentra en el rango de entre 19 y menos de 27 dólares, seguido por un empate de 16% de los rangos de 28 a <37 y de 46 a <55.
  • El 58% de los tickets presenta un monto de menos de 45 dólares.
  • El siguiente paso en tu proceso de resumir la información es representar gráficamente esa variable para visualizar más fácilmente su comportamiento.
Sigamos para aprender a emplear estas gráficas.

19/35

Una vez que tienes construída la distribución de frecuencia, para facilitar la comunicación y comprensión de los resultados, son de utilidad las representaciones gráficas. Ahora continúa para conocer las representaciones gráficas correspondientes a cada tipo de datos.

Histogramas y gráficos de barras

20/35

Ejemplo de gráficos para datos categóricos

Retomando el ejemplo de la encuesta realizada a 36 pacientes de un hospital para registrar el grado de molestia que están sintiendo, recuerda la tabla resultante:

21/35

Haz clic para ver imagen completa

Una primera propuesta de representación gráfica sería una gráfica de barras. En un eje, por lo general el horizontal, se especifican las etiquetas utilizadas para las clases. En el otro eje, por lo general el vertical, se coloca una escala de frecuencia, frecuencia relativa o frecuencia porcentual. Luego se traza una barra de cada etiqueta de clase y se extiende su longitud hasta llegar a la frecuencia de la clase. Para los datos categóricos, las barras deben estar a cierta distancia para recalcar el hecho de que cada clase está separada.

22/35

Se usa para representar los datos categóricos resumidos en una distribución de frecuencia, de frecuencia relativa o de frecuencia porcentual.

Para el caso de las encuestas realizadas en el hospital, las gráficas de barras quedarían de la siguiente manera para la frecuencia absoluta y la frecuencia porcentual.

Visualizar variables categóricas implica decidir cómo mostrar la información. Por ejemplo, es común que para las variables cualitativas se utilice el tipo de gráficos con las barras horizontales para diferenciarlos de los gráficos utilizados con las variables cuantitativas.

23/35

Haz clic para ver imagen completa

Gráficas de pay y de dona

Para la representación gráfica de las variables categóricas también se usan la gráfica de pay y la gráfica de dona. Ambas representan la frecuencia de cada categoría del nivel de malestar del ejemplo de los pacientes. Las partes (rebanadas) varían por el porcentaje de cada categoría con relación al total. Recuerda que cada círculo contiene 360 grados, por lo que el porcentaje correspondiente a cada categoría deberá de multiplicarse por esta cantidad para determinar el tamaño de la rebanada que le corresponde. Por ejemplo, para el nivel de malestar de “moderado” que pertenece al 36% de los pacientes, su operación resulta de la siguiente manera: Por lo tanto, las gráficas correspondientes son:

360 ∗ 0.36 = 129.6°

24/35

Ejemplo de gráficos para datos discretos

El histograma es una presentación gráfica común de los datos cuantitativos. Para elaborar un histograma, la variable de interés se coloca sobre el eje horizontal, y la frecuencia de que se trate sobre el eje vertical. Cada clase es representada por un rectángulo cuya base está determinada por los límites de clase sobre el eje horizontal, y cuya altura es la frecuencia, ya sea absoluta o relativa.Retomando el ejemplo de las edades de los futbolistas de la plantilla de la Selección Mexicana de Fútbol, recuerda que las tablas que finalmente obtuvimos son las siguientes:

Sus correspondientes histogramas serían de Frecuencias Absolutas y Frecuencias Porcentuales.

25/35

Lorem ipsum dolor sit amet, lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.

Este resumen gráfico se elabora para datos previamente resumidos, ya sea mediante una distribución de frecuencia, de frecuencia relativa o de frecuencia porcentual.

Haz clic para ver imagen completa

En conclusión...

Como viste, los rectángulos adyacentes de un histograma están en contacto uno con otro. A diferencia de una gráfica de barras, no existe una separación natural entre los rectángulos de las clases adyacentes. Este formato es el común en los histogramas, pero también es posible que en algunas disciplinas las prácticas sean distintas.La eliminación de los espacios entre las clases de un histograma ayuda a mostrar que todos los valores entre el límite inferior de la primera clase y el límite superior de la última clase son posibles.

26/35

Ejemplo de gráficos para datos continuos

La visualización de datos es un término que se emplea para describir el uso de representaciones gráficas para resumir y representar información de un banco de datos. En estos datos se utiliza el histograma en los datos cuantitativos continuos. Retomando el ejemplo del restaurante que ha realizado un análisis sobre los tickets de un día de ventas.

27/35

Su objetivo es comunicar la información clave sobre los datos lo más eficaz y claramente como sea posible. Para el caso de los datos continuos, las gráficas más frecuentemente utilizadas son el histograma, la ojiva (cuando la frecuencia es acumulada) y el polígono de frecuencias (utilizando las marcas de clase).

Su histograma queda de la siguiente manera:

Pero tenemos algunas alternativas más, vamos a conocerlas.

28/35

Otras alternativas

Tenemos como opción la ojiva . Recuerda que la frecuencia acumulada es la suma de las frecuencias de todas las clases con los valores de datos menores o iguales que el límite superior de dicha clase. Las correspondientes ojivas son las siguientes:

29/35

Haz clic para ver imagen completa

Nombre que recibe el histograma que utiliza las frecuencias acumuladas en lugar de las frecuencias de cada clase.

Una tercera opción de gráfico para datos continuos es el polígono de frecuencias, que se construye uniendo las marcas de clase en la parte superior del rectángulo de cada intervalo, formando así un gráfico lineal; el cual puede ser representado sobre un histograma, sobre una ojiva, o el gráfico solo. En el ejemplo del restaurante, la representación gráfica del polígono de frecuencias queda de la siguiente manera:

Polígono de Frecuencias Absoluta Acumulada

Polígono de Frecuencias Absoluta

30/35

Haz clic para ver imagen completa

Haz clic para ver imagen completa

Es importante resaltar que debajo de cada punto del gráfico lineal que representa el polígono de frecuencia se encuentran las frecuencias de los distintos intervalos en los que están agrupados los datos, representando la variación de los montos de un intervalo al otro. Es decir, el punto más alto sigue representando a la frecuencia de 11 tickets, cuyo monto se encuentra en el intervalo de 19 - <28 dólares. De igual manera, en la ojiva representa el acumulado de 16 a un monto menor que 28 dólares.

31/35

En resumen...

Los distintos métodos gráficos usualmente utilizados para los datos cuantitativos son los siguientes:

32/35

Haz clic para ver imagen completa

Distribución de los datos

  • Los histogramas nos proporcionan información acerca de la forma de la distribución de los datos dentro del rango de valores que toma la variable. Es importante mencionar que, si los datos con los que trabajas provienen de una muestra aleatoria de valores poblacionales, el histograma debe tener una forma de distribución razonablemente similar a los de la población.
  • Cuando la distribución ha sido mostrada gráficamente, podemos describir su patrón general así como detectar cualquier desviación relevante con relación al patrón. Si no estás familiarizado con la variable analizada, por lo general podrás interpretar varios hechos importantes que caracterizan a dicha variable.
Continúa para aprender a reconocer la distribución en los histogramas.

33/35

La distribución es la forma en que están organizados/desplegados los valores de la variable analizada, o bien la forma en que dichos valores se ordenan/arreglan en las diferentes clases del gráfico.

Estas son las formas más comunes que presenta un histograma, así como los términos más utilizados para describirlo. Revisa cada uno con atención.

34/35

Un histograma simétrico unimodal muestra una joroba, un pico prominente o punto más alto (clase con mayor frecuencia o clase modal). Además, se le considera distribución normal o distribución “campana de Gauss” debido a que esta joroba se encuentra en el centro, y la mitad izquierda del gráfico es un reflejo de la mitad derecha, es decir, presenta simetría.

Aquellos en los que hay dos picos en una distribución, los cuales están separados por al menos una clase. Es necesario aclarar que estas protuberancias no necesariamente son del mismo tamaño.

El pico se muestra en el lado izquierdo del gráfico, esta asimetría sucede debido a que la mayoría de los valores se encuentran concentrados en el lado izquierdo del gráfico, y por otro lado pocos datos se encuentran en el lado derecho. En otras palabras, la cola del gráfico está del lado derecho.

Son aquellos que presentan más de dos picos, es decir, tres o más de sus clases presentan frecuencias que sobresalen de las del resto de las clases.

El pico se muestra del lado derecho del gráfico, la mayoría de los valores se encuentran en el lado derecho (donde están los datos con valores mayores de la variable) y la cola del gráfico está en el lado izquierdo.

Son aquellos en los que no existe una moda, o si existe, su valor no sobresale del resto en una manera considerable. Es decir, no tiene algún valor alrededor del cual se concentran las observaciones. Más bien, vemos que las observaciones son aproximadamente uniformes.

Ejemplo de análisis

Ahora que conoces los tipos de histogramas y sus características, te sería más sencillo interpretar aquellos que obtuvimos en los ejemplos anteriores, de la siguiente manera:

35/35

¿De qué tipo de histograma consideras que se trata? Seguramente lo primero que observas es que la segunda clase, que abarca los montos de 19 a <28 dólares, sobresale del resto de las clases. Sin embargo, de la tercera clase en adelante las frecuencias son muy similares, por lo que el histograma no tiene cola. Por otro lado, la forma en que se distribuyen los datos alrededor de la clase central. Cuando sumamos las frecuencias de las primeras tres clases, tenemos un acumulado de 48% que representa el rango de 10 a <37 dólares; mientras que en el rango de 46 a <73, tenemos un acumulado de 42%. Por lo tanto, puedes concluir que hay cierto balance alrededor de la clase central, por lo que se puede considerar que sí cuenta con cierto grado de simetría. Tomando en cuenta tanto que no hay una clase sobresaliente, como que tiene simetría, pudieras considerar que se trata de un histograma uniforme simétrico. Podrás observar que, a simple vista, no siempre es fácil identificar el tipo de distribución del que se trata con solo ver el histograma. Más adelante en el curso aprenderás otras herramientas estadísticas que te ayudarán a clarificar el comportamiento de la distribución de la variable bajo estudio.

Haz clic para ver imagen completa

Bibliografía

En caso de que desees consultar alguna de las referencias disponibles en internet, copia y pega la liga en tu navegador de preferencia.

Stephen, D. (2017). Basic Business Statistics, Concepts and Applications. [Estadísticas Empresariales Básicas, Conceptos y Aplicaciones] New York: Pearson Education. Diaz S., P., & Pita, F. S. (2001, 04 2). Investigación: Representación gráfica en el análisis de datos. Retrieved from Wiki Educator: https://wikieducator.org/images/6/66/Representaci%C3%B3n_gr%C3%A1fica_en_el_An%C3%A1lisis_de_Datos.pdf Huff, D. (1954). How to Lie with Statistics. [Cómo mentir con las estadísticas]. New York: W W Norton & Company. Levin, R. I., & Rubin, D. S. (2004). Estadística Para Administración y Economía, Séptima Edición. Estado de México: Pearson Educación.

Estás avanzando muy bien, vayamos al siguiente recurso para conocer las gráficas del comportamiento de la relación de dos variables.

¡Muy bien!

Reiniciar lectura

Glosario

En esta lectura revisaste una serie de conceptos que tal vez no conocías, así que preparamos este glosario con las definiciones claves para que puedas revisarlas y tomar los apuntes necesarios.

Estadística

Estadística descriptiva

Estadísticas

Estadística inferencial

Población

Estadístico

Muestra

Estadista

Muestreo

Variable

Pensamientoestadístico

Unidad de análisis

Es la ciencia que permite recopilar, analizar, presentar e interpretar los datos.

Rama de la estadística que se enfoca en el análisis de los datos históricos con la finalidad de resumirlos a través de tablas, gráficos y/o números.

Es una filosofía que permite comprender un mundo complejo a través de términos más simples sin perder los aspectos esenciales de su estructura. La forma en que la información se ve, procesa y convierte en pasos de acción.

Es un conjunto de gráficas, datos, inferencias y observaciones obtenidas a través de la estadística.

Rama de la estadística que usa los datos obtenidos de una muestra para realizar estimaciones o probar hipótesis acerca de las características de una población (parámetro).

Conjunto de todos los elementos de interés en un estudio específico.

Es el resultado de una muestra y se utiliza para inferir el valor/comportamiento de la población en su totalidad (parámetro poblacional).

Es un subconjunto de la población.

También conocida como “elemento”. Se refiere a las entidades a partir de las cuales se recaban los datos. Por ejemplo: personas, objetos, familias, empresas en una industria específica, animales, países, eventos, etc.

Persona encargada de los asuntos específicos del Estado o gobierno.

Acción de recopilar la información de una muestra con el fin de comprender las características principales de una población.

Es una característica de interés para la unidad de análisis o elemento.