Del curso: Aprende análisis de datos: fundamentos
Trabajar con uniones y validación
Al unir datos, debes utilizar una columna que sea común en ambas tablas. Su nombre no es relevante, puede ser diferente. Debe tener el mismo tipo de datos. Para activar la ventana Propiedades, eliges la relación. su menú, Propiedades de la combinación. Pues aquí vemos que IdProducto de Producto se relaciona con IdDetalleOrden de Detalle. Esto no es correcto. Ejecuto la relación desde el menú Diseño de consultas, grupo Resultado, botón Ejecutar y veo que no hay datos. Es por ese error. Para ajustar el error, nos vamos a la consulta, activamos su menú contextual y la opción Vista diseño. Elimino esta relación que no es válida y creo una nueva relación. Elijo la columna IdProducto y la arrastro hasta la columna IdProducto de la tabla Detalle. De esta forma, al Ejecutar, obtengo los resultados esperados. Otro ejemplo es cuando nosotros nos encontramos que no hay relación entre las tablas. Cuando no hay relación entre dos tablas, se produce una combinación cruzada o CROSS JOIN que devuelve todos los registros de ambas tablas. En mis datos, hay más de 2000 filas en detalle y más de 500 en productos. En una combinación cruzada, se multiplican estos valores porque cada fila de productos se relaciona con cada fila de detalle. Te recomiendo comprobar si hay relación entre las tablas. En este caso, provocaría más de un millón de filas. Y también, cuando haya relación, comprueba siempre las columnas que participan. Cierro todo para ver otros casos. Veamos este. Vista diseño, de forma predeterminada, cuando unes dos tablas, producirá un tipo de unión interna o INNER JOIN. Vamos a verlo. Desde IdProducto hasta IdProducto activo las propiedades y veo que elige la Opción 1, donde se incluyen las filas donde los campos combinados en ambas tablas sean iguales, solo las coincidencias. Quiere decir que el resultado serían únicamente los productos que están en Detalle. Si queremos otro tipo de resultado, tenemos que buscar una combinación de tipo externa y no interna. Veamos. En este caso, he relacionado las dos tablas y tenemos la opción predeterminada, provocaría combinación interna o INNER JOIN. Pero hay otras dos posibilidades: incluir todos los registros de producto y solo aquellos registros de detalle coincidentes, quiere decir que se prioriza producto, y producto está a la izquierda. Esto provoca una combinación externa izquierda. El caso 3 sería priorizar la tabla detalle que está a la derecha, provocando una combinación externa derecha. Elijo la Opción 2 y voy a obtener todos los productos se hayan vendido o no. Acepto, ejecuto, y aquí tengo primero los productos que no se han vendido, IdOrden está vacío y luego los productos que sí se han vendido. Si mi objetivo es saber únicamente los productos que no se han vendido, quiero buscar que esta columna esté vacía. Regresamos a la Vista diseño y nos ubicamos en el panel que está debajo, en la fila Criterios y localizamos la columna IdOrden. Cuando estamos en esta fila y esta columna, escribimos «es nulo» y ejecutamos. Al ejecutar nos va a devolver únicamente aquellos productos que no se han ordenado. El requisito de informe determina qué datos vas a relacionar y también determina el tipo de relación que vas a utilizar. Como analista de datos tendrás mucha necesidad de trabajar con uniones o relaciones entre las tablas.
Contenido
-
-
-
-
-
Aprender a interpretar los datos existentes3 min 37 s
-
Encontrar datos existentes3 min 29 s
-
Limpieza de datos2 min 3 s
-
Comprender los datos y el flujo de trabajo5 min 47 s
-
Comprender las uniones3 min 49 s
-
Trabajar con uniones y validación4 min 39 s
-
Desafío: los productos no están categorizados45 s
-
Solución: los productos no están categorizados2 min 10 s
-
-
-
-
-
-