Oud examens voor
Datawetenschap
2024-2025 - Semester 2
Vragen theorie
1) Simpson's Paradox
- Vraag: Leg uit wat de Simpson's paradox inhoudt en geef een voorbeeld.
2) Jaccard Index ($J_{i,j}$)
3) Invloed van $\gamma$ ...
4) Referential Integrity (Referentiële Integriteit)
- Vraag: Wat is referentiële integriteit en hoe kan men dit bewaken/behouden in een dataset?
5) Berekening Precision, Recall en F1-score
- Vraag: Geef de berekeningen op basis van de volgende Confusion Matrix:
| Voorspeld: Positief | Voorspeld: Negatief |
|---|
| Werkelijk: Positief | 20 (TP) | 10 (FN) |
| Werkelijk: Negatief | 5 (FP) | (?) (TN) |
6) Invloed van standaardiseren op de accuraatheid
- Vraag: Bespreek de invloed van data-standaardisatie op de volgende algoritmen:
- a) KNN (K-Nearest Neighbors)
- b) Random Forest