Preparação de dados para análise | Prepare os dados e crie o Tableau Dashboard

Compartilhar no Facebook
Compartilhar no Twitter
Compartilhar no LinkedIn
Compartilhar no telegrama
Compartilhar no Whatsapp

Conteúdo

Este artigo foi publicado como parte do Data Science Blogathon.

Introdução

A análise visual pode contar aos usuários a história dos dados e ajuda a revelar vários relacionamentos que não são facilmente identificados em relatórios convencionais..

Neste artigo, Eu falo sobre a maneira que fiz um single painel no Tableau para divulgar as informações fornecidas pelos dados de origem que coletei de um ponto de investigação humanitária, ReliefWeb, apoiado pelo Escritório das Nações Unidas para a Coordenação de Assuntos Humanitários (OCHA).

Eu baixei o arquivo pdf sobre o relatório – Resposta ao Refugiado e Migrante do UNICEF na Europa: Relatório de situação humanitária n. ° 39 (do 1 de janeiro a 31 marchar 2021)”.

Neste artigo, Estou explicando algumas etapas comuns que você pode ter que seguir ao se preparar para a análise, como calcular novos campos e destacar várias ações para melhorar as visualizações e revelar insights ocultos.

Agora temos os dados e a próxima etapa é gerar informações a partir deste. Comecemos!

Como preparar os dados?

Primeiras coisas primeiro, temos que ter certeza de que todos os dados estão colocados corretamente na seção de dimensões e medidas e temos que limpar o Painel de dados.

Podemos dizer que no fluxo de trabalho de análise de dados, dados preparação é uma fase crítica. À medida que refinamos ainda mais os dados, podemos precisar apenas de alguns campos selecionados do arquivo de origem para nossa análise. Além disso, às vezes precisamos calcular campos de campos existentes para descrever o histórico de nossos dados claramente.

Dimensões e medidas:

O Tableau classifica os dados em dois (você pode ver a divisão no painel de dados): Dimensões e Medidas, onde o primeiro denota dados qualitativos (cor azul) e o segundo denota dados quantitativos (cor verde). Porém, ID de registro ou número de série é numérico e não precisa ser adicionado (soma ou média), em seguida, agrupados na seção Dimensões.

1cul4dd2aqsrbjydjc-jmww-3004305
A preparação de dados é uma etapa crítica na análise de dados. créditos de imagem: pixabay.com

Alguns métodos comuns que você pode aplicar na preparação de seus dados:

O Tableau tem muitas funções integradas vantajosas que podem transformar cálculos complicados em simples.

Você pode selecionar o campo apropriado no painel esquerdo e calcular o novo medidas disso. Se você deseja criar uma nova medida, no menu superior, sobre “Análise”, selecionar “Criar campo calculado” e escrever a fórmula para criar a nova medida. Exemplo: DATEDIFF ('minuto', [Hora de início], [Tempo de Acabamento]), esta fórmula retorna uma diferença de Starting Time e Finishing Time usando 'minuto’ como a unidade e pode ser usado para análise de tendências.

Um exemplo para calcular dimensão é o cálculo dos fins de semana e dias úteis:

SE DATEPART('dia', [StartingTime (Hora de Início)]) = 1
OR
DATEPART('dia', [Hora de início]) = 7
THEN
‘Weekend’
ELSE
‘Weekday’
END

O que mais, para dividir a informação em pequenas partes com diferentes perspectivas, Talvez precisemos nos inscrever Parte e corte muitas vezes na preparação de dados. Por exemplo, Se você quiser estender os dados definindo blocos de tempo. Isso pode ser composto por quatro períodos de seis horas.: Noite (12 AM-6 AM). Amanhã (6 uma. M. UMA 12 p. M.), Tarde (12 p. M. UMA 6 p. M.) E Noite (6 p. M. UMA 12 uma. M.). Em seguida, a fórmula pode ser escrita da seguinte forma::

IF 
DATEPART('hora', [Hora de início])>=0 
AND 
DATEPART('hora', [Hora de início]) < 6 
THEN 'Night' 
ELSEIF 
DATEPART('hora', [Hora de início])>=6 
AND
DATEPART('hora', [Hora de início]) < 12
THEN 'Morning'
ELSEIF DATEPART('hora', [Hora de início])>=12
AND
DATEPART('hora', [Hora de início]) < 18 
THEN 'Afternoon' 
ELSE 'Evening' 
END

Marcador– É uma ferramenta útil para encontrar padrões e identificar e destacar dados, mantendo o contexto de todos os dados na exibição. Exemplo: no menu superior, selecionar “Análise”> “Marcadores”> “Nome do campo”.

Para modificar as propriedades padrão, clique com o botão direito do mouse no nome do campo no painel Dados. Sobre “Propriedades padrão”> “Formato de número”, selecionar “Número (personalizado)” e você pode especificar os detalhes na janela aberta como a captura de tela abaixo.

1z1iwenss4ysmnsvgnqivwa-3619817
As propriedades padrão podem ser alteradas para os campos obrigatórios

Para mostrar janela de filtro com o botão Aplicar, Clique com o botão direito no seu campo para filtrar e clique “Mostrar filtro”. Uma pequena caixa seráexibida na legenda para filtrar no campo selecionado. A seguir, clique no ícone suspenso no canto superior direito e, sobre “Personalizar”, selecionar “Mostrar botão Aplicar”.

Durante o processo de preparação, você pode precisar limpar muito a mesa e, as vezes, combinar classificação e filtragem.

1vrmnx294ccb3wfx-ftx1sg-5908220
excluindo campos da tabela

Análise exploratória de tendências usando visualizações:

Podemos encontrar tendências nos dados usando um campo de data e hora, como examinar vários padrões de segundos, a hora, ano, etc.

Análise de tempo discreta e contínua:

O Tableau é ótimo para exibir o tempo como Discreto ou Contínuo quando aplicado a uma visualização. Ao arrastar um campo de data para a tela, você terá que decidir se deseja que seja contínuo ou discreto e em que nível deseja que seja apresentado (exemplo: o valor do dia, hora, minuto).

Você pode alterar o tipo de exibição para “Linha”, “Área”, “Barra”, etc. no Cartão de marca registrada. Para alterar o título na caixa de diálogo, você pode clicar duas vezes no eixo x ou eixo y. Para alterar o formato dos rótulos do eixo x, você pode clicar com o botão direito em um rótulo do eixo x e pode executar “Formato”. Para ativar rótulos de marca, no Cartão de marca registrada, selecione o ícone T para “Rótulo” e então verifique “Mostrar marcas de tag”. O que mais, o uso de “Cálculo rápido de tabelas”, Você também pode fazer medições calculadas de forma fácil e rápida.

1pk1urey3ogequri1_kdafg-8967739
Cálculo rápido de tabelas

Você pode ver a diferença entre computação através de contra baixa a mesa. Se fizéssemos o cálculo transversal, obteríamos a distribuição dos valores na tabela. Um não é necessariamente melhor que o outro, Depende apenas do que você está procurando! Ambos valem a pena explorar.

O que mais, O Tableau nos permite criar visualizações criativas como Gráfico de bolhas. Olhando para todas as bolhas juntas, podemos analisar as tendências gerais de nossa análise pela área das cores e o outro campo também pelo tamanho de todas as bolhas nesse campo.

1goensj8wnbebpajh8fpx0a-4439753
um exemplo de gráfico de bolhas no Tableau

Isso é o suficiente para se preparar para a análise.. Existem várias maneiras de obter uma resposta para sua pergunta, analisando o problema separadamente. A melhor solução seria um painel de controle que permite filtrar interativamente!! Na próxima parte, vamos reunir os dados em um painel interativo para que a resolução de nossas dúvidas seja muito simples.

A mídia mostrada neste artigo não é propriedade da DataPeaker e é usada a critério do autor.

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.