Combinar archivos CSV con Power Query

Share on facebook
Share on twitter
Share on linkedin
Share on telegram
Share on whatsapp

Contenidos

Este es el segundo de una serie de artículos en los que explico diferentes métodos para combinar datos de varios archivos en un solo libro / tabla. En el primer artículo describí cómo usar una función para combinar datos de libros de Excel idénticos en un solo archivo usando Power Query. La semana que viene cubriré un segundo método para hacer esto con los libros de Excel. Pero antes de cubrir el segundo método, pensé que valdría la pena hablar sobre cómo hacer esto con archivos CSV. Los archivos CSV son relativamente sencillos de combinar siempre que tengan el mismo formato y, por lo general, tengan un diseño tabular. Si necesita realizar una transformación significativa de los archivos CSV (p. Ej., Anular columnas y eliminar filas de datos que no se utilizan), es mejor que utilice el enfoque de función que se cubrió la última vez.

Resumen del enfoque

Esta es probablemente la forma más fácil de combinar varios archivos, sin embargo, solo funciona si tiene archivos CSV (u otro formato de texto). A continuación se muestra un resumen de los pasos seguidos de instrucciones.

  1. Coloque todos los archivos CSV en una carpeta
  2. Importe los archivos en la carpeta usando Power Query
  3. Expandir el contenido de todos los archivos.
  4. Elimine los encabezados duplicados no deseados de los archivos 2+.

1. Coloque todos los archivos CSV en una carpeta.

Los archivos CSV que estoy usando para esta demostración constan de 3 columnas con una sola fila de encabezado, como se muestra a continuación.

image_thumb-9439372

Tengo 3 de estos archivos para diferentes períodos, todos en la misma carpeta

image_thumb1-4630954

2. Importe el contenido de la carpeta con Power Query.

Luego creé un nuevo workbook en blanco y creé una nueva Power Query para importar el contenido de esta carpeta.

image_thumb2-5818991

Seleccione la carpeta correcta en el cuadro de diálogo y luego haga clic en Aceptar.

image_thumb3-3881678

3. Expanda el contenido de todos los archivos.

Hay muchas columnas que puede ver en la ventana de resultados de Power Query después de completar el paso anterior (principalmente metadatos sobre cada archivo). El único necesario para este proceso de combinación es la primera columna llamada [Content] marcado como 1 a continuación. Puede deshacerse de todas las demás columnas haciendo clic en la primera columna y luego seleccionando Eliminar columnas (2), Eliminar otras columnas (3).

image_thumb4-9386768

Después de eliminar todas las demás columnas, deberá hacer clic en el botón en la parte superior de la [Content] columna como se muestra a continuación (llamado combinar o expandir según su vista).

image_thumb5-9146223

Después de hacer clic en este botón, Power Query entra en acción y realiza una serie de pasos automáticamente para combinar los datos (4 pasos en mi caso). Puede verlos en la ventana Pasos aplicados a la derecha.

image_thumb6-1628921

Siempre debe verificar el paso «tipo cambiado» para asegurarse de que la suposición de Power Query sobre el tipo de datos para cada columna sea correcta. Para hacer esto, asegúrese de tener la barra de fórmulas encendida (pasos 1 y 2 a continuación). Seleccione el paso «tipo cambiado» de los Pasos aplicados y luego verifique la barra de fórmulas (3). Puede ver que Power Query ha identificado correctamente mis 3 columnas como de tipo Date, Integer e Integer. No es necesario que comprenda realmente el lenguaje de fórmulas de Power Query para poder confirmar estas cosas, ya que es bastante intuitivo.

image_thumb7-9972223

Si alguno de los formatos es incorrecto, simplemente haga clic en la (s) columna (s) y cambie el formato al correcto.

4. Elimina los encabezados no deseados.

El último paso es eliminar los encabezados no deseados. Como puede ver en los Pasos aplicados anteriores, el penúltimo paso son los «Encabezados promocionados». Este paso tomó la primera fila del primer archivo CSV y convirtió esta fila en los nombres de columna de la nueva tabla. Pero el problema es que cada archivo CSV tiene una copia exacta de esta fila de encabezado y estas filas existen en los datos.

Para eliminar los encabezados adicionales, haga clic en cualquiera de los botones de filtro de columna (se muestra como 1 a continuación). En mi ejemplo, hay más de 1,000 filas de datos y, por lo tanto, no puede ver el encabezado en la lista como lo indica la advertencia en 2 a continuación. Para resolver este problema, haga clic en el enlace «cargar más» (que se muestra como 3).

image_thumb8-7516189

Cuando hice esto para esta demostración, recibí un error que se muestra como 1 a continuación. El problema es que la fila de encabezado que debe eliminarse consta de la palabra «Fecha», pero la palabra «Fecha» no se puede formatear como tipo «Fecha» (este cambio de formato de datos fue ejecutado automáticamente por Power Query en el paso anterior). Puede eliminar el paso «Tipo cambiado» si lo desea, pero lo más fácil es simplemente seleccionar el segundo último paso (que se muestra como 2 a continuación) antes de completar este paso de filtro.

image_thumb9-5033797

Entonces, para que funcione, primero seleccione el segundo último paso (que se muestra como 1 a continuación), luego haga clic en el filtro en una de las columnas (2 a continuación). A continuación, verá la fila de encabezado llamada «Fecha» en la lista de valores. Anule la selección de esta fila de encabezado (que se muestra como 3) y luego haga clic en Aceptar.

image_thumb10-5786592

Ahora puede hacer clic en FileClose and Load y el proceso está completo.

Hacer lo mismo con los libros de Excel

Excel es ligeramente diferente y necesita alguna intervención manual, por lo que ese es un tema para la próxima semana.

Si desea una lección completa sobre cómo usar Power Query, consulte mi curso de capacitación aquí. https://exceleratorbi.com.au/product/power-query-excel-power-bi-online-training/

!function(f,b,e,v,n,t,s)
{if(f.fbq)return;n=f.fbq=function(){n.callMethod?
n.callMethod.apply(n,arguments):n.queue.push(arguments)};
if(!f._fbq)f._fbq=n;n.push=n;n.loaded=!0;n.version=’2.0′;
n.queue=[];t=b.createElement(e);t.async=!0;
t.src=v;s=b.getElementsByTagName(e)[0];
s.parentNode.insertBefore(t,s)}(window,document,’script’,
‘https://connect.facebook.net/en_US/fbevents.js’);
fbq(‘init’, ‘639916389503636’);
fbq(‘track’, ‘PageView’);

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.