Dieser Artikel bietet ein umfassendes Glossar mit Data Analysis Terms und deckt die grundlegende Terminologie, Definitionen und das Vokabular der Datenanalyse für Anfänger und Profis ab.
Read in English (Auf Englisch lesen).
Datenanalyse ist der Prozess, Daten zu analysieren, um nützliche Informationen abzuleiten, die dann für datenbasierte Entscheidungen genutzt werden können. Die Datenanalyse umfasst im Allgemeinen sechs Schritte: eine Frage beantworten, Rohdatensätze vorbereiten, Daten für die Analyse verarbeiten, Daten analysieren, Ergebnisse teilen und entsprechend handeln.
Datenanalysten sind Daten-Experten, die Daten sammeln, bereinigen, untersuchen und interpretieren, um Geschäftsprobleme zu lösen. Sie arbeiten in der Regel mit anderen Datenanalyse-Experten wie Data Scientists und Data Engineers zusammen.
Dieses anfängerfreundliche Glossar mit Data Analysis Terms kann eine nützliche Referenz sein, wenn Sie eine Karriere im Datenbereich starten oder Ihre Datenkenntnisse verbessern möchten.
Im folgenden Glossar finden Sie gängige Begriffe aus der Datenanalyse.
Bei der Arbeit in Tabellen oder Datenbanken ist ein Attribut ein allgemeiner Deskriptor zur Beschriftung einer Spalte. Durch die klare und präzise Beschriftung von Spalten können Sie Ihre Daten übersichtlich und für die Analyse bereithalten.
Ein Changelog, auch Änderungsprotokoll genannt, ist eine Liste, die alle Schritte dokumentiert, die Sie bei der Arbeit mit Ihren Daten unternommen haben. Dies kann hilfreich sein, falls Sie zu Ihren ursprünglichen Daten zurückkehren oder sich daran erinnern müssen, wie Sie Ihre Daten für die Analyse vorbereitet haben.
Eine CSV-Datei ist eine Textdatei, deren Daten durch Kommas getrennt sind. Dies ist ein gängiger Dateityp beim Herunterladen von Datendateien zur Analyse, da er in der Regel mit gängiger Tabellenkalkulations- und Datenbanksoftware kompatibel ist.
Ein Dashboard ist ein Tool zur Überwachung und Anzeige von Live-Daten. Dashboards sind in der Regel mit Datenbanken verknüpft und bieten Visualisierungen, die automatisch aktualisiert werden, um die aktuellsten Daten in der Datenbank anzuzeigen.
Datenanalytik ist die Erfassung, Transformation und Organisation von Daten, um Schlussfolgerungen zu ziehen, Vorhersagen zu treffen und fundierte Entscheidungen zu ermöglichen. Datenanalytik umfasst Datenanalyse (den Prozess der Informationsgewinnung aus Daten), Datenwissenschaft (die Nutzung von Daten zur Theoriebildung und Prognose) und Datentechnik (den Aufbau von Datensystemen). Data Analysts, Data Scientists und Data Engineers sind allesamt Datenanalytik-Experten.
Es gibt vier Haupttypen der Datenanalytik:
Deskriptive Analytik verrät, was passiert ist
Diagnostische Analytik verrät, warum etwas passiert ist
Prädiktive Analytik verrät, was wahrscheinlich in der Zukunft passieren wird
Präskriptive Analytik verrät, wie wir handeln sollen
Erfahren Sie mehr: Vertiefen Sie Ihre analytischen Fähigkeiten und treffen Sie wirkungsvolle Entscheidungen mit Kursen zur Datenanaltik.
Datenarchitektur ist der Plan für das Datenmanagementsystem eines Unternehmens. Dies kann alle Berührungspunkte im Datenlebenszyklus umfassen, einschließlich der Erfassung, Organisation, Nutzung und Vernichtung der Daten. Datenarchitekten entwerfen Blueprints, die Unternehmen für ihre Datenmanagementsysteme verwenden.
Erfahren Sie mehr: Lernen Sie mit Kursen zur Datenarchitektur, effektive Datensysteme zu entwerfen und den Informationsfluss zu optimieren.
Datenbereinigung ist der Prozess der Vorbereitung von Rohdaten für die Analyse. Beim Bereinigen Ihrer Daten stellen Sie sicher, dass diese korrekt, vollständig, konsistent und unvoreingenommen sind. Es ist wichtig, vor der Analyse saubere Daten zu haben, da unsaubere oder verfälschte Daten zu ungenauen Schlussfolgerungen und falschen Geschäftsentscheidungen führen können.
Erfahren Sie mehr: Tauchen Sie mit Kursen zur Datenbereinigung tiefer in die Datenvorbereitung ein
Data Engineering ist der Prozess, Daten für Analysen zugänglich zu machen. Data Engineers entwickeln Systeme, die Rohdaten sammeln, verwalten und in nutzbare Informationen umwandeln. Zu den häufigsten Aufgaben gehören die Entwicklung von Algorithmen zur Umwandlung von Daten in eine nützlichere Form, der Aufbau von Datenbank-Pipeline-Architekturen und die Entwicklung neuer Datenanalyse-Tools.
Erfahren Sie mehr: Erwerben Sie mit Data Engineering-Kursen wichtige Fähigkeiten zum Erstellen von Datenpipelines und -architekturen.
Bei der Datenanreicherung, auch Data Enrichment genannt, werden Daten zu Ihrem bestehenden Datensatz hinzugefügt. Normalerweise reichern Sie Ihre Daten während der Datentransformation an, wenn Sie sich auf die Analyse vorbereiten und feststellen, dass Sie zusätzliche Daten benötigen, um Ihre Geschäftsfrage zu beantworten.
Data Governance ist der formale Plan für die Verwaltung von Unternehmensdaten in einer Organisation. Data Governance umfasst Regeln für den Zugriff auf und die Nutzung von Daten und kann Verantwortlichkeits- und Compliance-Regeln beinhalten.
Erfahren Sie mehr: Meistern Sie die Strategien zur Verwaltung von Datenintegrität, Sicherheit und Compliance mit Data Governance-Kursen.
Datenintegrität umfasst die Genauigkeit, Zuverlässigkeit und Konsistenz von Daten im Laufe der Zeit. Sie beinhaltet die Aufrechterhaltung der Qualität und Zuverlässigkeit von Daten durch die Implementierung von Schutzmaßnahmen gegen unbefugte Änderungen, Fehler oder Datenverlust.
Beim Data Mining werden Daten eingehend untersucht, um Muster zu erkennen und Erkenntnisse zu gewinnen. Data Mining ist ein zentraler Aspekt der Datenanalyse. Die dabei gewonnenen Erkenntnisse fließen in Ihre Geschäftsempfehlungen ein.
Erfahren Sie mehr: Schöpfen Sie das Potenzial von Big Data aus, indem Sie mit Data-Mining-Kursen Mustererkennung und Erkenntnisgewinnung meistern.
Data Science ist die wissenschaftliche Untersuchung von Daten. Data Scientists stellen Fragen und finden Wege, diese Fragen mithilfe von Daten zu beantworten. Sie erfassen Daten, transformieren Rohdaten in eine nutzbare Form, analysieren Daten und erstellen prädiktive Modelle.
Erfahren Sie mehr: Entdecken Sie datengesteuerte Erkenntnisse und schaffen Sie Innovationen mit Data Science-Kursen.
Data Wrangling, auch Data Munging oder Data Remediation genannt, ist der Prozess der Umwandlung von Rohdaten in eine nutzbare Form. Der Munging-Prozess umfasst vier Phasen: Ermittlung, Datentransformation, Datenvalidierung und Veröffentlichung. Die Datentransformationsphase kann weiter in Aufgaben wie Datenstrukturierung, Datennormalisierung bzw. -denormalisierung, Datenbereinigung und Datenanreicherung unterteilt werden.
Erfahren Sie mehr: Verbessern Sie Ihre Fähigkeiten zur Datenmanipulation und optimieren Sie Ihren Analyseprozess mit Data Wrangling-Kursen.
Eine Datenbank ist eine organisierte Sammlung von Informationen, die durchsucht, sortiert und aktualisiert werden können. Diese Daten werden häufig elektronisch in einem Computersystem, einem sogenannten Datenbankmanagementsystem (DBMS), gespeichert. Für die Interaktion mit der Datenbank benötigen Sie häufig eine Programmiersprache wie SQL (Structured Query Language).
Erfahren Sie mehr: Meistern Sie die Kunst der Verwaltung und Optimierung von Datenbanken mit Kursen zur Datenbankverwaltung.
Eine Datenquelle bezeichnet den Ursprung eines bestimmten Satzes von Informationen. Da Unternehmen Jahr für Jahr immer mehr Daten generieren, nutzen Datenanalysten verschiedene Datenquellen, um den Geschäftserfolg zu messen und strategische Empfehlungen abzugeben.
Datenvisualisierung ist die Darstellung von Informationen und Daten mithilfe von Diagrammen, Grafiken, Karten und anderen visuellen Hilfsmitteln. Mit aussagekräftigen Datenvisualisierungen können Sie das Storytelling fördern, Ihre Daten einem breiteren Publikum zugänglich machen, Muster und Zusammenhänge erkennen und Ihre Daten weiter erforschen.
Erfahren Sie mehr: Verwandeln Sie Daten mit Kursen zur Datenvisualisierung in überzeugende visuelle Geschichten.
Metadaten sind Daten über Daten. Sie beschreiben verschiedene Merkmale Ihrer Daten, z. B. wie sie erfasst wurden, wo sie gespeichert sind, ihren Dateityp oder das Erstellungsdatum. Metadaten können insbesondere für Verifizierungs- und Nachverfolgungszwecke nützlich sein.
Open Data, auch offene Daten genannt, sind Daten, die jeder nutzen kann. Das Erkunden und Analysieren offener Datensätze ist eine Möglichkeit, Datenanalysefähigkeiten zu üben.
Qualitative Daten beschreiben Eigenschaften oder Merkmale. Sie sind in der Regel nicht numerisch und können subjektiv sein, beispielsweise die Augenfarbe oder Emotionen.
Quantitative Daten sind objektive Daten mit einem bestimmten numerischen Wert. Sie lassen sich in der Regel zählen oder messen, wie zum Beispiel Größe oder Geschwindigkeit.
Eine Abfrage ist eine Informationsanfrage. Im Wesentlichen handelt es sich dabei um die Frage, die Sie einer Datenbank stellen, um die gewünschten Daten abzurufen. In der Datenanalyse formulieren Sie Ihre Datenbankabfragen mithilfe einer Abfragesprache wie Structured Query Language (SQL).
Eine relationale Datenbank enthält mehrere Tabellen mit zugehörigen Informationen. Obwohl die Daten in separaten Tabellen gespeichert sind, können Sie mit einer einzigen Abfrage auf zugehörige Daten aus mehreren Tabellen zugreifen. Beispielsweise kann eine relationale Datenbank eine Tabelle für Lagerbestände und eine andere für Kundenbestellungen enthalten. Wenn Sie in Ihrer relationalen Datenbank nach einem bestimmten Produkt suchen, können Sie sowohl Lagerbestands- als auch Kundenbestellinformationen gleichzeitig abrufen.
Saubere Daten sind präzise, vollständig und bereit zur Analyse. Die Datenbereinigung, ein wichtiger Schritt im Datenanalyseprozess, umfasst die Überprüfung Ihrer Daten auf Ungenauigkeiten, Inkonsistenzen, Unregelmäßigkeiten und Verzerrungen.
Strukturierte Daten sind formatierte Daten, beispielsweise in Zeilen und Spalten organisierte Daten. Strukturierte Daten lassen sich aufgrund ihrer übersichtlichen Formatierung leichter analysieren als unstrukturierte Daten.
Structured Query Language (SQL, ausgesprochen „sequel“) ist eine Programmiersprache zur Verwaltung relationaler Datenbanken. Sie gehört zu den gängigsten Sprachen für die Datenbankverwaltung.
Erfahren Sie mehr: Entfesseln Sie die Leistungsfähigkeit der Datenbankverwaltung und Abfrageoptimierung mit SQL-Kursen.
Unstrukturierte Daten sind Daten, die nicht offensichtlich organisiert sind. Um unstrukturierte Daten analysieren zu können, müssen Sie in der Regel eine Organisation implementieren.
Verbessern Sie Ihre analytischen Fähigkeiten mit den verfügbaren Kursen zur Datenanalyse. Egal, ob Sie gerade erst anfangen oder Ihre Fähigkeiten verbessern möchten – diese Kurse vermitteln Ihnen die Tools und Erkenntnisse, die Sie für datenbasierte Entscheidungen benötigen. Nutzen Sie die Gelegenheit, Ihre Datenanalyse-Kompetenzen zu verbessern. Entdecken Sie Kurse, die Ihnen helfen können, Ihre Karriere und darüber hinaus maßgeblich zu beeinflussen. Starten Sie noch heute Ihr Lernabenteuer und verwandeln Sie Ihre Datenerkenntnisse in umsetzbare Ergebnisse.
Zu den fünf Hauptprozessen der Datenanalyse gehören die Datenerfassung (Sammlung relevanter Daten), die Datenbereinigung (Beseitigung von Fehlern und Inkonsistenzen), die Datenverarbeitung (Organisation der Daten für die Analyse), die Dateninterpretation (Ableitung von Erkenntnissen) und die Datenvisualisierung (Darstellung der Ergebnisse durch Diagramme und Grafiken)
Die vier Haupttypen der Datenanalyse sind die deskriptive Analyse (Zusammenfassung vergangener Daten), die diagnostische Analyse (Ermittlung der Ursachen von Trends), die prädiktive Analyse (Vorhersage künftiger Ergebnisse) und die präskriptive Analyse (Vorschläge für Maßnahmen auf der Grundlage von Datenerkenntnissen)
Redaktion
Das Redaktionsteam von Coursera besteht aus äußerst erfahrenen professionellen Redakteuren, Autoren ...
Diese Inhalte dienen nur zu Informationszwecken. Den Lernenden wird empfohlen, eingehender zu recherchieren, ob Kurse und andere angestrebte Qualifikationen wirklich ihren persönlichen, beruflichen und finanziellen Vorstellungen entsprechen.