Want to make creations as awesome as this one?

Transcript

STatistiek

training module

Índex

1

2

3

4

5

6

7

Terminologie

frequentie tabellen

Statistische grafieken

frequentie tabellen van gegroepeerde gegevens

Histogram

Centrummaten

SPreidingsmaten

Terminologie

Populatie: de populatie is de verzameling van elementen waarop men statistisch onderzoek wil uitvoeren.

Steekproef: de steekproef is dat deel van de populatie waarop het onderzoek effectief wordt uitgevoerd.

Element: elk element van de steekproef.

Terminologie

Kwalitatief: kan niet voorgesteld worden door een getal. Bv: een automerk

Kwantitatief: wordt voorgesteld door een getal. Bv: een leeftijd

Discreet: neemt alleen bepaalde waarden aan. Bv: een schoenmaat

Continu: kan alle waarden van een interval aannemen. Bv: een gewicht

Soorten statistische variabelen

Een statistische variabele is een eigenschap of een kenmerk. De variabele is datgeen waarnaar men onderzoek wil doen.We onderscheiden volgende soorten variabelen:

Terminologie

In een statistisch onderzoek worden volgende fases doorlopen:* Er wordt een representatieve steekproef opgesteld.* De data wordt verzameld.* De data wordt geanalyseerd.* Er worden conclusies getrokken.

Samen kunnen we het doen!

Frequentietabellen

Van de data die uit het onderzoek wordt verkregen, met als doel om de data te kunnen analyseren, wordt alles geteld en in een frequentietabel geordend.

In een frequentietabel worden de waardes aangenomen door de statistische variabele, xi, voorgesteld met hun bijhorende frequenties: de absolute frequentie, ni; dit is het aantal keer dat xi voorkomt in de telling, en de relatieve frequentie, fi; dit is de verhouding tussen de absolute frequentie en het totale aantal gegevens.fi = ni/N

De cumulatieve absolute frequentie, Ni: is de som van de absolute frequenties kleiner dan of gelijk aan xi.De cumulatieve absolute frequentie van de laatste waarde is gelijk aan het totale aantal gegevens.De cumulatieve relatieve frequentie, Fi: is de verhouding tussen de cumulatieve absolute frequentie en het totale aantal gegevens.Fi=Ni/N

Frequentietabellen

We onderzoeken het aantal tweets geplaatst door 24 leerlingen van een klas.

Voorbeeld

+info

Om de data te analyseren, turven we en ordenen alles in een frequentietabel

Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.

In frequentietabellen wordt de data van een statistische variabele georganiseerd en bestudeerd, maar om de data voor te stellen zijn er efficiëntere manieren; de statistische grafieken.

Statistische grafieken

Let's do it!

Als de middens van de bovenste lijnstukken van elke staaf verbonden worden, krijgen we een nieuwe grafiek die het frequentiepolygoon genoemd wordt.

In een staafdiagram stelt de lengte van elke staaf bijhorende frequentie voor. Staafdiagrammen worden gebruikt voor kwalitatieve en quantitatieve gegevens.

Staafdiagram en frequentiepolygoon

Staafdiagram

Frequentiepolygoon

voorbeeld

Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.

In een cirkeldiagram met procenten wordt elke waarde voorgesteld door dat deel van de taart dat in verhouding de juiste oppervlakte heeft.

cirkeldiagram

De grootte van elk gebied is het product van de relatieve frequentie en 360°.Cirkeldiagrammen zijn zinvol bij een klein aantal verschillende waardes van de variabele.

Voorbeeld

Voorbeeld

Als een statistische variabele quantitatief continu of discreet is, maar met veel verschillende waardes dan groeperen we de data in intervallen om het tellen te vergemakkelijken.Om frequentietabellen te construeren met data gegroepeerd in intervallen wordt het gemiddelde van elk interval genomen als representatieve waarde voor het interval. De waarde wordt het klassemidden xi genoemd. De bijhorende frequenties worden op dezelfde manier berekend als voor discrete variabelen.

Frequentietabellen van gegroepeerde gegevens

Hier zie je een voorbeeld van het aantal polsslagen per minuut, gemeten bij 50 personen. De polsslagen varieren tussen 56 en 100 per minuut, en worden opgedeeld in intervallen per 5 polsslagen.

FREQUENTIETABELLEN VAN GEGROEPEERDE GEGEVENS

example

Als data in intervallen gegroepeerd wordt, gebruiken we een nieuwe soort grafiek om die voor te stellen; het histogram. In een histogram wordt elk interval voorgesteld door een rechthoek waarvan de lengte het interval is, en de hoogte zijn frequentie. Als we de klassemiddens verbinden krijgen we het frequentiepolygoon.

Histogram

De modus is de waarde van de variabele die meest voorkomt. In sommige gevallen kan er meer dan één modus zijn. Voor data gegroepeerd in intervallen is wordt het meest voorkomende interval het modale interval genoemd.

Modus

Centrummaten

Clara krijgt 6, 7, 6, 6, 8, 9 en 7 als resultaten voor oefeningen in de turnles. Wat is de modus?De modus is hier 6, aangezien 6 meest voorkomt, nl 3 keer.

Voorbeeld

Het rekenkundig gemiddeld verkrijgen door alle data op te tellen en te delen door het totaal aantal gegevens. Om het gemiddelde te vinden in een frequentietabel vermenigvuldigen we elke waarde met zijn absolute frequentie en delen we door het totaal aantal gegevens. Voor data gegroepeerd in intervallen wordt met de klassemiddens gewerkt.

Voorbeeld

Centrummaten

We vinden het Clara's gemiddelde door haar resultaten op te tellen en te delen door het totaal aantal resultaten.Gemiddelde = (6+7+6+6+8+9+7) / 7 = 7

Gemiddelde

Voorbeeld

De mediaan is de centrale waarde van de variabele. Dat betekent dat de hoeveelheid data kleiner dan de mediaan is gelijk aan de hoeveelheid data groter dan de mediaan. Om de mediaan te berekenen ordenen we de data van klein naar groot: als we te maken hebben met een oneven aantal gegevens, dan is de mediaan de middelste van de gegevens. Als we te maken hebben met een even aantal gegevens, dan is de mediaan het rekenkundige gemiddelde van de twee middelste waardes. Als we ook nog de mediaan Q1 zoeken van de gegevens kleiner dan de mediaan en de mediaan Q3 van de gegevens groter dan de mediaan, dan verdelen we de data in 4 even grote delen. Voor gegroepeerde data is de mediaan het klassemidden van het interval waartoe de mediaan behoort.

Mediaan

Centrummaten

Om de mediaan van Clara's resultaten te bepalen, ordenen we de data van klein naar groot: 6 6 6 7 7 8 9.De middelste waarde is de mediaan, hier is de mediaan 7. Als Clara één extra resultaat 6 had, dan was de mediaan 6+7/2 = 6,5.

Spreidingsmaten

Soms is het belangrijk om te weten hoe dichtbij of hoe veraf de data van het gemiddelde ligt.

Voorbeeld

De variatiebreedte is het verschil tussen de grootste en de kleinste waardes van de variabele.

Variatiebreedte

Spreidingsmaten

De hoogste dagtemperatuur wordt gedurende 20 dagen opgemeten in gebieden A en B. De resultaten zijn:Gebied A: 14, 18, 20, 22, 24, 21, 21, 18, 17, 17, 17, 14, 18, 20, 20, 21, 21, 20, 17 en 20Gebied B: 19, 21, 21, 24, 25, 25, 24, 24, 18, 19, 18, 17, 25, 25, 23, 25, 23, 17, 24 en 23De variatiebreedte van gebied A is 24-14 = 10, en van gebied B is dat 25-17 = 8

In het geval van gegroepeerde data is de variatiebreedte het verschil tussen de bovengrens van het hoogste interval en de ondergrens van het kleinste interval.

Voorbeeld

De variantie s² is het gemiddelde van de kwadraten van de afstanden waarop de gegevens afliggen van het gemiddelde.

Variantie

Spreidingsmaten

Bereken de variantie van de temperaturen van de 2 gebieden

Als we de positieve vierkantswortel s van de variantie s² bepalen, dan vinden we de gemiddelde afwijking van de gegevens ten opzichte van het gemiddelde.Deze s noemen we de standaardafwijking.

Standaardafwijking

Spreidingsmaten

Voorbeeld

De standaardafwijking s van de temperaturen in gebied A is

De standaardafwijking s van de temperaturen in gebied B is

Einde van de module

Hopelijk heb je iets bijgeleerd!