Del curso: Aprende análisis de datos: fundamentos

Limpieza de datos

Del curso: Aprende análisis de datos: fundamentos

Limpieza de datos

Cuando tratas con datos para tus informes, vas a explorarlos y limpiarlos. ¿Qué es la limpieza de datos? Se puede definir simplemente. Es el proceso de estandarizar los datos y hacerlos significativos. Si trabajas con Excel para crear tus informes, es probable que estés limpiando muchos datos. Puedes filtrar las columnas que no son necesarias para el modelo de datos y el informe, o eliminar espacios adicionales en un texto utilizando la función de Excel que se llama Espacios. O quizás, convertir todos los valores de una columna en abreviaturas y darles formato de letras mayúsculas. Es posible que hayas recibido datos donde la información de la dirección está en una columna, pero necesitas dividirla en columnas individuales. Se pueden filtrar las filas no válidas para el informe. Si necesitas solo las ventas que han completado el proceso, puedes eliminar las filas de datos de las ventas que no han finalizado. Son válidas para el proceso de ventas, pero no son válidas para el tipo de informes que estás escribiendo. También puedes quitar los datos duplicados de un conjunto grande para crear un conjunto que sea apropiado para tu caso de negocios. Todos estos son ejemplos de transformaciones de limpieza de datos, de acciones a realizar, para crear ese conjunto de datos limpio y agradable. Siempre es importante que trabajes con un objetivo clave en mente, que es un conjunto de datos de alta calidad que puedas utilizar. Debes tener confianza del resultado y debes poder hablar sobre la limpieza que aplicaste a los datos. Así que asegúrate de tomar buenas notas.

Contenido