O que é um warehouse e o que um data warehouse moderno deve contemplar?

Conteúdo

Uma definição do que é um armazém em relação aos dados., ou mais especificamente um armazém de dados, poderia ser a seguinte: Um armazém de dados é um sistema que se utiliza para informar e analisar dados. o Os armazéns de dados são repositórios centrais de dados. que integram uma ou mais fontes de dados diferentes. Armazenam dados atuais e históricos e são utilizados para criar relatórios analíticos para os trabalhadores do conhecimento em toda a empresa.

istock-521808958-4548861

Créditos fotográficos: MickeyCZ

Para compreender completamente o que é o armazém e o processo de armazenamento de dados É necessário ter em conta as três camadas gerais, embora não sejam obrigatórias, são frequentemente utilizadas, dependendo da arquitetura de armazenamento de dados:

  • Camada de integração en el que se almacenan y preparan los datos brutos extraídos.
  • Capa de datos principal depósito donde los datos se adaptan al modelo de datos homogéneo de la empresa.
  • Data marts y capa de marts estratégicos, que proporciona extratos específicos del almacén de datos corporativo.

Estas capas a menudo cuentan con una lógica empresarial y de transformación interna compleja y, as vezes, no se pueden distinguir facilmentemente como bloques de construcción discretos. Los desarrollos recientes han simplificado esto y permiten optimizaciones significativas.

Comprender los diferentes componentes para saber qué es un almacén

Hoje dia, Quienes saben qué es un depósito entienden que este depósito de datos ya no solo se alimenta de la información generada por los sistemas internos. Esses tempos ficaram para trás e a realidade a nível de arquitetura de dados de qualquer organização é diferente. Novos formatos, fontes de dados alternativas e diferentes tipos de informação Dão complexidade a uma estrutura essencial no processo de geração de conhecimento.

Entre os elementos que compõem o armazém de dados, e cujo entendimento permite saber o que é o armazém, são como segue:

  1. Serviços de acesso a dados: Ao contrário dos armazéns de informação tradicionais, os atuais requerem capacidades de serviço de acesso a dados ampliadas. Só assim é possível garantir o acesso a fontes NoSQL, a comutação flexível entre métodos de acesso aos dados, a transformação de dados não estruturados ou a adaptação a fontes na nuvem. , acesso a fontes NoSQL e capacidades de qualidade e transformação para geocodificação e dados não estruturados. Todas estas diferentes tecnologias devem ser geridas e monitorizadas pelo repositório de dados lógicos. É importante que as soluções de armazenamento de dados ofereçam um elevado grau de flexibilidade nesta área.
  2. Preparação de dados: Este componente é responsável por realizar a revisão e correção de dados. Graças à sua intervenção, pode ser garantida a fiabilidade da fonte (linhagem de dados), bem como o cumprimento das condições mínimas de exaustividade, integridade e outros atributos da qualidade dos dados. A preparação de os dados é especialmente importante para trabalhar com dados não estruturados, apesar de, são precisamente estes os que requerem a participação de especialistas no processo, apoiados nas ferramentas adequadas.
  3. Modelagem– Num ambiente de armazenamento de dados moderno, as necessidades de modelagem estão estreitamente relacionadas com a capacidade de lidar com diferentes semânticas de dados provenientes de várias fontes.. Entender o que é um armazém é assumir que A abordagem de modelagem não deve ser única, mas sim adaptável aos processos empresariais e às necessidades da organização.
  4. Metadados: os dados sobre dados ganham importância nos novos armazéns, uma vez que precisam ser capazes de assimilar as mudanças na forma como os dados são representados. Os metadados permitem descobrir o contexto e a natureza independentemente da sua representação real.

O atual armazém de dados diversificado deve estar preparado para satisfazer as necessidades dos utilizadores., sejam elas relacionadas com informações locais, ou com big data ou com a nuvem.

(função(d, s, Eu iria) {
var js, fjs = d.getElementsByTagName(s)[0];
E se (d.getElementById(Eu iria)) Retorna;
js = d.createElement(s); js.id = id;
js.src = “//connect.facebook.net/es_ES/all.js#xfbml=1&status = 0”;
fjs.parentNode.insertBefore(js, fjs);
}(documento, 'roteiro', 'facebook-jssdk'));

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.

Datapeaker