Want to make creations as awesome as this one?

PARADIGMA EDUCATIVO TRANSCOMPLEJO CON UN EJEMPLO DE CLASE DE MATEMÁTICAS

Transcript

Estadística para científicos de datos

Vamos a entender la estadística de muestras de poblaciones. El comportamiento de las medias, las varianzas y las desviaciones que hay en los datos para su futuro análisis

3. Características

2. Distribución Normal

4. Test AB

1. Introducción

ÍNDICE

EVALUACIÓN:25% TRABAJO EN EQUIPO65% EXÁMEN FINAL10% COMUNICACIÓN EN CLASE Y PARTICIPACIÓN EN FOROSTutorías al correo:profesor@universidad.com

CONTENIDO: Diapositivas de clase:www.aulavirtual.esPágina con información sobre el curso: https://umecit.educativa.Foro equipos:www.foro.umecit.com

Conocimientos básicos

Introducción a la estadísticaProblemas de distribucionesCálculos de intervalos

Antes de comenzar... Para entender la clase, puedes aprovechar los siguientes materiales para seguir de forma más sencilla la clase.

En esta unidad veremos cómo sacar conclusiones de una muestra de datos teniendo en cuenta distintos escenarios. Y para estudiar este comportamiento, podremos aplicar la estadística inferencial y la regresión. Pero ¿qué son estos términos?

Introducción

La función principal de la estadística inferencial es facilitar un pronóstico de un conjunto de datos; teniendo una muestra poblacional, podremos obtener valores porcentuales estadísticos de toda la información de la que partimos con, además, un porcentaje de error. Asimismo, la regresión nos ayuda a obtener tendencias y predecir posibles datos futuros. Es un método esencial en Data Analytics y sólo se aplica cuando se cumplen unas hipótesis que dependen directamente de parámetros de la estadística inferencial. Por tanto, estas dos herramientas, tanto la estadística inferencial como la regresión, nos van a ayudar a definir planes de acción en caso de que se presente un problema nuevo.

Es la distribución de probabilidad de una variable continua. Y para entenderlo, veamos el siguiente ejemplo

Distribución Normal

Análisis exploratorio

Cuando tenemos un conjunto de datos estadísticos y queremos representarlos en una función continua y sencilla de manejar, podemos emplear la distribución normal.

¿Y si generamos una gráfica con estos datos?

datos de altura de LA población

Pensemos EN EQUIPO

¿Cómo lo hacemos?

Personas con una altura más común

Personas con una altura menos convencional

Generamos un gráfico

Cuestionario

¿Cuál sería la respuesta correcta?

https://datosmacro.expansion.com/demografia/poblacion

Poblaciones del mundo

+Info

Prueba tú mism@ con ayuda de...

Entendamos en profundidad...

Qué características tiene esta distribución

características de la Distribución Normal

La distribución normal se denota como N(μ,σ)

podremos conocer el parámetro de la desviación típica (σ) que nos hace ver si un valor se aleja mucho de la media o no

Podemos representar de forma sencilla la media poblacional

Características

la curva es simétrica

Si toda el área es 1, se puede equiparar a que el 100% de la población está dentro de esos valores, y en caso de querer conocer el % de población que mide más de un determinado valor, calcularíamos la integral desde el valor a infinito para saber el área (equivalente al % de población).

Tiene una asíntota horizontal, es decir existen límites en los extremos de la función que tienden a infinito

VAMOS A CALCULAR UN PROBLEMA

- La función es simétrica

Pero ¿qué utilidad tiene esto?

El área entre la función y el eje horizontal es igual a 1.

Además,

Sabemos que ..

resultado equivalente al % de población que mide más de x_1.

por eso, existen tablas !!

probemos nosotros

La fórula es:

Pero es una fórmula compleja

Pensemos

Tenemos una distribución normal N (170,12) que representa la altura de un país. ¿Qué porcentaje mide menos de 185 cm?

tipificamos

qué es esto?

Dibujamos la gráfica pero vemos que no tenemos la media en el centro !!

y recordamos que es una fórmula compleja, y preferíamos usar las tablas

¿qué es la tipificación?

vs

tipificación

distribución normal

Este z=1,25 en una distribución N (0,1) equivale al x=185 (denominado en el sistema de referencia como X) en una distribución N (170,12).

Buscamos P(X≤185), y tenemos μ=170 y σ=12. Vamos a calcular la nueva posición del eje horizontal:

PASO 1

P(X≤185)= P(Z≤1,25)=0,8944.

Es decir, el 89,44% de la población mide menos de 185cm

Ahora sí, podríamos utilizar la tabla de integrales diciendo que:

PASO 2

Hagamos equipos de 3 personas para resolver el problema

a) ¿Cuál es el porcentaje de población que mide más de 149cm? b) ¿Qué estatura mínima tiene el 80% de la población?

Pensemos EN EQUIPO

Tras haberlo entendido, es vuestro turno!

b) Destipificamos.

a) P(X>149)= P(Z>-1,75)= P(Z≤1,75)=0,9599.

Resultado ...

Tras todo lo aprendido, nos hemos dado cuenta de que la gestión de datos estadísticos es esencial por ejemplo en el mundo del marketing. Cuando queremos vender un producto, nos basamos en hipótesis que están relacionadas sobre los futuros clientes y esto nos ayuda a tomar mejores decisiones ante nuestras ventas.

TEST AB

Para realizar este test de hipótesis, necesitamos dar tres pasos principales: 1. Conseguir una muestra de datos suficientemente representativa. 2. Plantear las hipótesis sobre el objetivo que buscamos. En el apartado anterior conocíamos en todo momento el tipo de hipótesis que debíamos emplear, sin embargo, dependiendo de los objetivos que busquemos, nuestra hipótesis nula puede cambiar. - Planteamos las hipótesis - Definimos el nivel de confianza α - Comprobamos si la información pertenece a nuestro intervalo de aceptación (con ayuda de la tipificación, el cálculo de z). 3. Tener un procedimiento estadístico para saber si la hipótesis marcada es la correcta o no.

y este con ejemplos de empresas reales como Google:

Léete este artículo para saber más sobre Test A/B:

Info

Info

google

ejemplos de empresas que usan test ab

amazon

deberíamos emplear la estadística para corroborar este contraste de hipótesis

A priori deducimos que la mejor página web es la B, ya que, 60 ventas es mayor que 38. Sin embargo

ejemplo

Supongamos que la página A ha generado 38 ventas y la página B un total de 60 ventas

Tenemos dos páginas web distintas a las que acceden todos los días 100 personas (importante que el número de datos de la muestra sea el mismo para poder compararlo correctamente).

PASO 3. Comprobaremos si los valores están dentro del intervalo de aceptación con ayuda del estadístico de contaste z. El Test A/B ejecutamos la prueba sobre los datos de la muestra que hemos obtenido. El valor que nos devuelve es un pvalor: - Si pvalor<α, podemos rechazar la hipótesis nula que habíamos planteado - Si pvalor>α, no podemos rechazar la hipótesis nula que habíamos planteado.

ejecutamos en python

PASO 1. En primer lugar, vamos a definir las hipótesis: - HIPÓTESIS NULA – Las ventas en ambas páginas son las mismas. - HIPÓTESIS ALTERNATIVA – Las ventas en ambas páginas son significativamente diferentes.

PASO 2. Luego, necesitamos saber si es 100% la hipótesis. Al estar en el terreno de la probabilidad, como mínimo debemos definir un α, una probabilidad mínima de fallo. Si queremos trabajar a un 95% de confianza, definiremos el α como 5%.

la complejidad es la estrategia para enfrentar lo inesperado.Inténtalo tú sol@

archivo python con el código

con bastante más detalle

¿Cómo se puede aplicar el Test A/B sin necesidad de ejecutar un código?

+Info

Prueba tú mism@ con ayuda de...

MATERIAL

Material de clase: www.aulavirtual.esPágina web universidad:https://umecit.educativa.org/

¡Muchas gracias!

Altura

Los asiáticos suelen tener una altura inferior al resto de la población

¿Tienes una idea?

¡Que fluya la comunicación!

Con las plantillas de Genially podrás incluir recursos visuales para dejar a tu audiencia con la boca abierta. También destacar alguna frase o dato concreto que se quede grabado a fuego en la memoria de tu público e incluso embeber contenido externo que sorprenda: vídeos, fotos, audios... ¡Lo que tú quieras!¿Necesitas más motivos para crear contenidos dinámicos? Bien: el 90% de la información que asimilamos nos llega a través de la vista y, además, retenemos un 42% más de información cuando el contenido se mueve.

  • Genera experiencias con tu contenido.
  • Tiene efecto WOW. Muy WOW.
  • Logra que tu público recuerde el mensaje.
  • Activa y sorprende a tu audiencia.

Altura

Los norteamericanos tienen una estatura estándard en comparación con personas Europeas procedentes de los países nórdicos.

Altura

Los países nórdicos suelen tener alturas mayores