Semi-gestructureerde gegevens zijn gegevens die niet voldoen aan een strikt schema of model, maar toch een bepaald niveau van organisatie of structuur hebben. Dit type gegevens bevat elementen van beide gestructureerde en ongestructureerde data, omdat het tags of metadata kan bevatten die een bepaald niveau van context bieden.
Semi-gestructureerde gegevens komen vaak voor in verschillende digitale bronnen, zoals XML- en JSON-bestanden, logbestanden en gegevens van sociale media. Het wordt vaak gebruikt voor toepassingen die meer nodig hebben flexbaar datamodel, zoals webapplicaties of data gegenereerd door IoT-apparaten.