Domein E: Statistiek en Kansrekening

Wiskunde C VWO
Alleen Schoolexamen (SE) - niet op CE!

Examen Strategie - Domein E

Kansrekening in Context - Wat vaak mist in overzichten:

In de examens moet je vaak kansen combineren in een tekstverhaal. Het gaat niet alleen om formules, maar om het begrijpen van de situatie.

Voorbeeld (Examen 2024 - Drielingen):
"Wat is de kans dat minstens een van de drielingen een jongen is?"
Aanpak: Bereken het complement! P(minstens 1 jongen) = 1 - P(geen jongens) = 1 - P(3 meisjes)
Veelvoorkomende vraagtypen:
- "Minstens een..." = Gebruik complement: 1 - P(geen enkele)
- "Precies k van de n..." = Gebruik binomiaalverdeling
- "Gegeven dat..." = Voorwaardelijke kans P(A|B) = P(A en B) / P(B)
- "Onafhankelijk" = Kansen vermenigvuldigen
- "Of" (niet exclusief) = P(A) + P(B) - P(A en B)

Centrummaten

Gemiddelde (rekenkundig)
x̄ = (x₁ + x₂ + ... + xₙ) / n

Som van alle waarden gedeeld door het aantal.

Data: 4, 7, 8, 9, 12
Gemiddelde: (4+7+8+9+12)/5 = 40/5 = 8
Mediaan

De middelste waarde als je de data ordent van klein naar groot.

Mediaan = waarde op positie (n+1)/2
Oneven aantal: 3, 5, 7, 9, 11 → mediaan = 7
Even aantal: 3, 5, 7, 9 → mediaan = (5+7)/2 = 6
Voordeel mediaan: Niet gevoelig voor uitschieters!
Modus

De waarde die het vaakst voorkomt.

Data: 2, 3, 3, 3, 5, 7, 7
Modus: 3 (komt 3× voor)
Let op: Er kunnen meerdere modi zijn, of geen modus als alle waarden even vaak voorkomen.
Gewogen gemiddelde
x̄ = Σ(wᵢ × xᵢ) / Σwᵢ

Elk getal krijgt een "gewicht" (hoe belangrijk het is).

Cijfers: SE 6,0 (weegt 3×), CE 7,5 (weegt 2×)
Gewogen gem: (3×6,0 + 2×7,5)/(3+2) = 33/5 = 6,6
Wanneer welke centrummaat?
SituatieBeste keuze
Normale verdeling, geen uitschietersGemiddelde
Scheve verdeling of uitschietersMediaan
Categorische dataModus
Ongelijke gewichtenGewogen gemiddelde

Spreidingsmaten

Spreidingsbreedte (Range)
Range = Maximum - Minimum
Data: 3, 5, 7, 12, 15
Range: 15 - 3 = 12
Nadeel: Zeer gevoelig voor uitschieters!
Kwartielen
  • Q₁ (1e kwartiel): 25% van de data ligt eronder
  • Q₂ (mediaan): 50% ligt eronder
  • Q₃ (3e kwartiel): 75% ligt eronder
Kwartielen bepalen:
1. Orden de data van klein naar groot
2. Bepaal de mediaan (Q₂)
3. Q₁ = mediaan van de onderste helft
4. Q₃ = mediaan van de bovenste helft
Interkwartielafstand (IQR)
IQR = Q₃ - Q₁

De "middelste 50%" van de data.

Voordeel: Niet gevoelig voor uitschieters!
Standaardafwijking (σ of s)
σ = √(Σ(xᵢ - x̄)² / n)

Gemiddelde afwijking van het gemiddelde.

Lage σ: Data ligt dicht bij gemiddelde
Hoge σ: Data is verspreid
Op de rekenmachine: Gebruik de statistiek-functies!
σx = populatie, sx = steekproef
Variantie
σ² = Σ(xᵢ - x̄)² / n

Het kwadraat van de standaardafwijking.

Variantie = (standaardafwijking)²
Boxplot (Vijf-getallensamenvatting)
min
max

Min — Q₁ — Mediaan — Q₃ — Max

Statistische Diagrammen

Histogram
  • Voor continue data in klassen
  • Staven raken elkaar
  • Y-as: frequentie of frequentiedichtheid
  • Oppervlakte stelt frequentie voor
Let op bij ongelijke klassen!
Gebruik frequentiedichtheid = frequentie / klassebreedte
Staafdiagram
  • Voor discrete of categorische data
  • Staven raken elkaar NIET
  • Y-as: frequentie
  • Hoogte stelt frequentie voor
Cirkeldiagram
  • Toont verhoudingen (percentages)
  • Totaal = 360°
Hoek = (deel/totaal) × 360°
25% van totaal: 0,25 × 360° = 90°
Lijndiagram / Tijdreeks
  • Voor data over tijd
  • X-as: tijd
  • Y-as: gemeten waarde
  • Punten verbonden met lijnen
Spreidingsdiagram (Scatterplot)
  • Toont verband tussen twee variabelen
  • Elk punt = één waarneming
  • Zoek naar patronen: lineair, kromlijnig, geen verband
Cumulatieve frequentie

Optelling van frequenties tot en met een bepaalde waarde.

  • Ogief: grafiek van cumulatieve frequentie
  • Handig voor aflezen mediaan en kwartielen

Kansrekening

Kans berekenen
P(A) = gunstige uitkomsten / mogelijke uitkomsten
Dobbelsteen: P(6 gooien) = 1/6 ≈ 0,167
Kans is altijd: 0 ≤ P(A) ≤ 1
Somregel (OF)
P(A of B) = P(A) + P(B) - P(A en B)

Uitsluitend: Als A en B niet samen kunnen:

P(A of B) = P(A) + P(B)
Productregel (EN)

Onafhankelijke gebeurtenissen:

P(A en B) = P(A) × P(B)

Afhankelijke gebeurtenissen:

P(A en B) = P(A) × P(B|A)
Complementregel
P(niet A) = 1 - P(A)
P(minstens één 6 in 3 worpen):
= 1 - P(geen enkele 6)
= 1 - (5/6)³ = 1 - 0,579 = 0,421
Gebruik bij "minstens één"!
Voorwaardelijke kans
P(B|A) = P(A en B) / P(A)

De kans op B, gegeven dat A al gebeurd is.

Onafhankelijkheid

A en B zijn onafhankelijk als:

P(A en B) = P(A) × P(B)

Of: P(B|A) = P(B)

Voorbeelden onafhankelijk:
• Twee dobbelstenen werpen
• Munten opgooien

Afhankelijk:
• Trekken zonder teruglegging
Verwachtingswaarde
E(X) = Σ xᵢ × P(xᵢ)

Het "gemiddelde" dat je verwacht bij vaak herhalen.

Dobbelsteen:
E(X) = 1×(1/6) + 2×(1/6) + ... + 6×(1/6) = 21/6 = 3,5

Normale Verdeling

Kenmerken normale verdeling
  • Klokvorm (Gauss-curve)
  • Symmetrisch rond het gemiddelde
  • Gemiddelde = mediaan = modus
  • Bepaald door μ (gemiddelde) en σ (standaardafwijking)
X ~ N(μ, σ)
68-95-99,7 regel
  • 68% ligt binnen μ ± 1σ
  • 95% ligt binnen μ ± 2σ
  • 99,7% ligt binnen μ ± 3σ
IQ-scores: μ = 100, σ = 15
68% heeft IQ tussen 85 en 115
95% heeft IQ tussen 70 en 130
Standaardnormale verdeling
Z ~ N(0, 1)

μ = 0 en σ = 1

Z-score berekenen:

z = (x - μ) / σ
IQ van 130: z = (130-100)/15 = 2
"2 standaardafwijkingen boven gemiddelde"
Kansen berekenen (rekenmachine)
Stappenplan:
1. Noteer μ en σ
2. Gebruik normalcdf(onder, boven, μ, σ)
3. Of: bereken z-score en gebruik tabel
GR-functies:
• normalcdf(a, b, μ, σ) = P(a < X < b)
• invNorm(p, μ, σ) = x-waarde bij kans p
Wanneer normaal verdeeld?
  • Lengte, gewicht van mensen
  • Meetfouten
  • IQ-scores, testscores
  • Som van veel onafhankelijke variabelen
Niet normaal verdeeld:
Inkomen, wachttijden, levensduur producten (vaak scheef!)

Steekproeven en Onderzoek

Populatie vs Steekproef
  • Populatie: Hele groep waar je uitspraken over wilt doen
  • Steekproef: Deel van de populatie dat je onderzoekt
Goede steekproef:
• Groot genoeg (n ≥ 30 is vuistregel)
• Representatief (lijkt op populatie)
• Aselect (willekeurig gekozen)
Soorten steekproeven
TypeMethode
Aselecte steekproefWillekeurig, elk element evenveel kans
GestratificeerdPopulatie in groepen, uit elke groep aselect
SystematischElke n-de persoon (bijv. elke 10e)
GelegenheidssteekproefWie beschikbaar is (niet representatief!)
Betrouwbaarheidsinterval

Een interval waarbinnen de werkelijke waarde waarschijnlijk ligt.

x̄ ± z × (σ / √n)
  • 95% betrouwbaar: z ≈ 1,96
  • 99% betrouwbaar: z ≈ 2,58
Groter n: smaller interval (nauwkeuriger)
Correlatie en Causaliteit
  • Correlatie: Samenhang tussen variabelen
  • Causaliteit: De ene veroorzaakt de andere
Correlatie ≠ Causaliteit!
IJs-verkoop en verdrinkingen zijn gecorreleerd, maar ijs veroorzaakt geen verdrinking. Beide worden veroorzaakt door warm weer!
Correlatiecoëfficiënt r
-1 ≤ r ≤ 1
  • r = 1: Perfect positief lineair verband
  • r = -1: Perfect negatief lineair verband
  • r = 0: Geen lineair verband
  • |r| > 0,8: Sterk verband
  • 0,5 < |r| < 0,8: Matig verband
Regressielijn

Beste rechte lijn door de punten:

ŷ = ax + b
  • Minimaliseert de som van de kwadratische afwijkingen
  • Gaat door (x̄, ȳ)
  • Gebruik GR voor a en b!

Formule Overzicht - Domein E

Centrummaten Gemiddelde: x̄ = Σxᵢ/n

Mediaan: middelste waarde

Modus: meest voorkomende
Spreidingsmaten Range: max - min

IQR: Q₃ - Q₁

Standaardafwijking: σ = √(Σ(xᵢ-x̄)²/n)
Kansrekening P(A of B) = P(A) + P(B) - P(A∩B)

P(A en B) = P(A) × P(B)

P(niet A) = 1 - P(A)
Normale verdeling 68-95-99,7 regel

Z-score: z = (x-μ)/σ
Verwachtingswaarde E(X) = Σ xᵢ × P(xᵢ)
Betrouwbaarheid x̄ ± z × (σ/√n)

95%: z ≈ 1,96
Meest gemaakte fouten:
1. Histogram: oppervlakte i.p.v. hoogte bij ongelijke klassen
2. Correlatie verwarren met causaliteit
3. Bij mediaan: vergeten data te ordenen
4. Productregel gebruiken bij afhankelijke gebeurtenissen
5. 68-95-99,7 regel: σ i.p.v. 2σ of 3σ gebruiken

Tips voor het Schoolexamen

Rekenmachine statistiek
Ken deze functies:
• 1-Var Stats: gemiddelde, σ, mediaan, kwartielen
• LinReg: regressielijn y = ax + b
• normalcdf: kans bij normale verdeling
• invNorm: x-waarde bij gegeven kans

Oefen dit VOOR het examen!
Contextvragen
  • Lees goed wat er gevraagd wordt
  • Controleer of steekproef representatief is
  • Let op eenheden
  • Rond pas aan het einde af
  • Geef antwoord in context ("Er is 68% kans dat...")
Veelvoorkomende vraagtypen
  • "Bereken de kans dat..." → Kansregels
  • "Hoeveel procent..." → Normale verdeling + GR
  • "Is er een verband..." → Correlatie, spreidingsdiagram
  • "Is de steekproef representatief..." → Steekproefmethode bespreken
  • "Geef een boxplot..." → Min, Q₁, mediaan, Q₃, max