Del curso: Aprende análisis de datos: fundamentos
Mantenimiento de los datos originales
En un mundo de ensueño, ejecutaríamos conjuntos de datos de calidad de nuestros sistemas, pero no siempre es así. Es posible que sólo recibamos una hoja de cálculo o que tengamos acceso limitado para exportar. En algunos casos, recibiremos un archivo CSV. Es importante mantener los datos originales que has exportado o recibido. Te enumero dos ventajas. La capacidad de reiniciar sin tener que comenzar de nuevo y también te da la posibilidad de crear una traza de auditoría. Hablemos de un ejemplo de la vida real. No tienes acceso a los datos originales. Recibes lo que necesitas del departamento de TI, probablemente de un administrador de bases de datos. Luego realizas tus procesos de limpieza, escribes tus informes y los entregas a tu equipo mes a mes. Te mostraré cómo yo trabajo con estos datos que recibo. En un escenario como este, guardo el archivo que me fue entregado en una carpeta dedicada para este tipo de solicitudes. No me fío del correo electrónico como mi fuente. Normalmente, empiezo creando una carpeta llamada Datos originales. Debes crear una estructura de carpetas que tenga sentido para ti. Archivar es muy importante y es muy personal también. Necesitarás mantener tus datos originales y tus rutinas de limpieza básica. Aquí tengo la carpeta con un archivo de datos y le activé la propiedad para que fuese de solo lectura. Elijo el archivo, me voy a Propiedades y aquí tengo Solo lectura. Hemos recibido un archivo CSV, que es de solo lectura, y así no se estropea. Creé una copia de este archivo que se mantiene siendo de solo lectura y me lo he llevado a la carpeta Datos. Este archivo ahora es un archivo Excel y además ya no es de solo lectura, admite transformaciones. Ahora tengo la copia del archivo original en su carpeta y un archivo de trabajo. Sobre este archivo he realizado transformaciones básicas que ya tengo preparadas. Quité unas columnas que sobraban, ajusté el ancho de columnas y las convertí, estas columnas, en una tabla. Estas son algunas tareas que se corresponden con mi rutina de limpieza básica. Todas las transformaciones las he dejado en un archivo que se llama Encuesta_Uso_Limpio. Esta es una información que se puede mostrar. Muchas veces las personas necesitan ver algunos de los datos para saber qué pedir a continuación. Digamos que este archivo de trabajo ya está listo. Solo me queda crear una copia de esta hoja para poder volver a ella si lo necesito. Se aplica una técnica muy sencilla. Pongo el puntero del ratón en la pestaña de la hoja, mantengo seleccionada la tecla Control del teclado, presiono y arrastro. Notarás que hay una pequeña flecha y una hoja con un signo más que indica una copia. Suelto primero el ratón y luego el Control. Vamos a cambiarlo a Datos Empleo Trabajo. Sobre esta hoja voy a trabajar. Si necesito cambios, no tendría que empezar desde cero, desde los datos originales, porque he mantenido intacta mi copia con la rutina de limpieza básica. Hay muchas formas de mantener tus archivos en función de tu organización. Puedes guardarlos en una carpeta del servidor o en una unidad en la nube. Solo asegúrate de mantenerte al día con el trabajo para no tener que reinventar la rueda por un solo error.