Het analyseren van Amerikaanse babynamen
Op deze pagina, leer je over het analyseren van grote datasets.
Hoe werkt het als je gegevens gaat analyseren die uit miljoenen stukjes informatie bestaan, in plaats van
een
paar honderd? Grote datasets bieden uitdagingen en kansen voor het ontdekken van nieuwe informatie.
Baby Name Voyager. Deze visualisatie toont de 1000 meest populaire namen van
jongens en meisjes geboren in de Verenigde Staten voor alle jaren tussen 1880 tot 2014.
Als de grafiek niet meer reageert of leeg is, laad hem dan opnieuw.
- Wat was de populairste meisjesnaam in de jaren 1900? En in de jaren 1960?
- Welke jongensnamen zijn tegenwoordig veel minder populair dan in 1880?
- Typ in wat je denkt dat de meest populaire naam op jouw school is. Is deze naam nog steeds populair
voor nieuwe baby's?
- Wat kun je nog meer vinden? Zoek wat interessante informatie in de gegevens en bereid je vervolgens
voor om het aan je klas te laten zien.
- Had je moeite bij het beantwoorden van een van deze vragen? Wat is er niet zo duidelijk
aan deze visualisatie? Hoe zou je het kunnen verbeteren?
De Baby Name Voyager is een indrukwekkende visualisatie van een grote dataset. Deze gegevens zijn afkomstig
van de Social Security
Administration, een tekstbestand voor elk jaar van 1880 tot 2014. Het bekijken van de gegevens in
dit tekstbestand zou je niet bepaald veel inzicht geven!
Grote datasets bieden unieke uitdagingen en kansen:
Visuele en interactieve applicaties zijn vooral waardevol
om te gebruiken als je grote datasets bekijkt. Zonder deze applicaties kunnen grote datasets onbegrijpelijk
zijn. In de kaart rechts wordt YesYesNo gebruikt
om de paden van hardlopers in kaart te brengen.
- Met de data van het CBS kun je zelf een data-analyse maken. Je kunt de data van 2014 hier
vinden. Voor andere jaren kun je hier kijken.
- Denk eens aan een grote dataset die je zelf hebt gemaakt en probeer deze visueel te maken met
Snap!. Let op, grote datasets kunnen teksten, geluiden, plaatjes en video’s bevatten.