Erstellen von Datenprofilen in Power BI

Teilen auf Facebook
Teilen auf twittern
Teilen auf verlinktin
Teilen auf Telegramm
Teilen auf WhatsApp

Inhalt

Microsoft hat heute das Oktober-Update veröffentlicht 2018 von Power BI Desktop. Eine der großartigen neuen Funktionen, die veröffentlicht wurde, ist die Möglichkeit, ein visuelles Profil Ihrer Daten in Power Query zu erhalten, BEVOR die Daten geladen werden. Dieses neue Feature ist typisch für die Art von Entwicklungsarbeit, in die Microsoft mit seinen Produkten investiert.. MS versucht, Ihnen das Leben zu erleichtern, indem es Ihnen die Werkzeuge zur Verfügung stellt, die Sie benötigen, um die Arbeit zu erledigen, ohne alles von Grund auf selbst erledigen zu müssen..

Was ist Datenprofilierung??

Data Profiling ist ein Verfahren, das Data Scientists im Umgang mit Daten verwenden. Zusammenfassend, es ist ein bisschen so, als würde man einen Schritt zurücktreten und sich die allgemeine Form und Struktur der Daten ansehen. Es ist, als würde man den Wald im Allgemeinen anstelle der Bäume betrachten. Lass mich dir zeigen, wie es geht.

Vorschaufunktion für die Datenprofilerstellung aktivieren

Datenprofilierung ist (im Oktober 2018) eine Vorschaufunktion. Aktivieren Sie es in den alternativen Einstellungen

imagen imagen

Sie müssen Power BI neu starten, damit die Änderungen wirksam werden.

Einige Daten laden und profilieren

Ich lade Adventure Works-Daten. Haben 5 Tabellen, aus denen das Datenmodell besteht. Wenn ich die Daten mit Power BI hochlade, Wählen Sie Bearbeiten, um Power Query zu starten.

Als Anmerkung, es ist sehr schön zu sehen, dass Microsoft zunehmend auf die Marke verweist “Power-Abfrage” in der Benutzeroberfläche und Unterhaltungen über Betrug. Persönlich, Ich denke, Power Query kann eine so solide Marke sein wie R oder Python, Wenn Microsoft der Technologiemarke nur ein Eigenleben ermöglicht, auch wenn sie in Produkten wie Power BI und Excel lebt.

Die erste Datenprofilierungsfunktion ist sehr subtil. Beachten Sie den grünen Balken im Bild unten. Bei Fehlern in den Spalten, der Prozentsatz der Fehler wird mit einem Prozentsatz dieses Balkens in unterschiedlicher Farbe angezeigt. Rot für Fehler, grau für leer, grün bis ok.

imagen

Als nächstes ging ich zum Menü Ansicht (1) und Spaltenverteilung aktiviert (2) y Säulenqualität (3) wie im Folgenden gezeigt. Dann passiert etwas Wunderbares: Sehen Sie sich die Datenprofilinformationen an, die in . angezeigt werden 4 dann.

imagen

Datenprofilierungstools untersuchen die erste 1.000 Zeilen der geladenen Vorschaudaten und zeigt Ihnen das Gesamtbild, wie die Daten „aussehen“.

Im Augenblick, das Profiling-Tool funktioniert nur auf 1000 oberste Datenzeilen. Auch die Erstellung des Profils der Stützen nimmt einige Zeit in Anspruch (wie konnten wir warten), trotz dieses, die Vorteile, dies richtig zu tun, bevor Sie fortfahren, überwiegen bei weitem langsamere Ladezeiten (IMO). Ich würde gerne eine Option sehen, um den gesamten Datensatz für eine oder mehrere Spalten zu profilieren. Ich bin sicher, das wird kommen.

Was halten Sie von dieser neuen Funktion?? Ich liebe.

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.