Uit de cursus: Big data in tijden van AI

Krijg toegang tot deze cursus met een gratis proefabonnement

Word vandaag lid en krijg toegang tot meer dan 24.100 cursussen geleid door branchedeskundigen.

Uitdagingen tijdens gegevensvoorbereiding

Uitdagingen tijdens gegevensvoorbereiding

- [Verteller] Zalm kan gekweekt worden of ze kunnen in het wild gevangen worden. Maar hoe dan ook, het kost behoorlijk wat werk voordat ze hierin worden omgezet. Iedereen weet dat voedselvoorbereiding een belangrijk, maar tijdrovend en vaak vervelend onderdeel van koken is. Er is een soortgelijk principe in elk big data-project. De vuistregel is dat ongeveer 80 procent van de tijd op een big data-project wordt besteed aan het voorbereiden van de gegevens. En dat is mijn eigen ervaring geweest. Nu zijn er verschillende redenen waarom dit het geval kan zijn. Het omvat zaken als hoe worden de gegevens ingevoerd? Als je wild gevangen gegevens gebruikt, dat wil zeggen gegevens die je daar in de wereld hebt ontdekt en die misschien met vrije tekst zijn ingevoerd. Je moet kijken naar zaken als plaatsnamen. Hier zijn vier verschillende manieren om Californië aan te geven. Je kunt het uitschrijven, je kunt verschillende afkortingen gebruiken en het opnemen van een punt. In ieder geval…

Inhoud