Data wrangling (of munging) transformeert ruwe data in een gestructureerd formaat voor analyse. Het proces omvat:
- Gegevens verzamelen uit verschillende bronnen.
- Het aanpakken van fouten en inconsistenties.
- Het transformeren van de gegevens naar een bruikbaar formaat.
Het gegevensverwerkingsproces verwerkt ontbrekende waarden, verwijdert dubbele gegevenspunten en converteert gegevenstypen naar een geschikt formaat. Daarna zijn de gegevens klaar voor verdere taken, zoals machinaal leren of statistische analyse.