Data Analysis Terms und Definitionen

Geschrieben von Coursera Staff • Aktualisiert am

Dieser Artikel bietet ein umfassendes Glossar mit Data Analysis Terms und deckt die grundlegende Terminologie, Definitionen und das Vokabular der Datenanalyse für Anfänger und Profis ab.

[Hauptbild] Zwei Dala-Analysten untersuchen Diagramme und Grafiken, die auf ein weißes Smartboard projiziert werden.

Read in English (Auf Englisch lesen).

Datenanalyse ist der Prozess, Daten zu analysieren, um nützliche Informationen abzuleiten, die dann für datenbasierte Entscheidungen genutzt werden können. Die Datenanalyse umfasst im Allgemeinen sechs Schritte: eine Frage beantworten, Rohdatensätze vorbereiten, Daten für die Analyse verarbeiten, Daten analysieren, Ergebnisse teilen und entsprechend handeln.

Datenanalysten sind Daten-Experten, die Daten sammeln, bereinigen, untersuchen und interpretieren, um Geschäftsprobleme zu lösen. Sie arbeiten in der Regel mit anderen Datenanalyse-Experten wie Data Scientists und Data Engineers zusammen.

Dieses anfängerfreundliche Glossar mit Data Analysis Terms kann eine nützliche Referenz sein, wenn Sie eine Karriere im Datenbereich starten oder Ihre Datenkenntnisse verbessern möchten.

Data Analysis Terms

Im folgenden Glossar finden Sie gängige Begriffe aus der Datenanalyse. 

Attribut

Bei der Arbeit in Tabellen oder Datenbanken ist ein Attribut ein allgemeiner Deskriptor zur Beschriftung einer Spalte. Durch die klare und präzise Beschriftung von Spalten können Sie Ihre Daten übersichtlich und für die Analyse bereithalten.

Changelog

Ein Changelog, auch Änderungsprotokoll genannt, ist eine Liste, die alle Schritte dokumentiert, die Sie bei der Arbeit mit Ihren Daten unternommen haben. Dies kann hilfreich sein, falls Sie zu Ihren ursprünglichen Daten zurückkehren oder sich daran erinnern müssen, wie Sie Ihre Daten für die Analyse vorbereitet haben.

CSV-Datei 

Eine CSV-Datei ist eine Textdatei, deren Daten durch Kommas getrennt sind. Dies ist ein gängiger Dateityp beim Herunterladen von Datendateien zur Analyse, da er in der Regel mit gängiger Tabellenkalkulations- und Datenbanksoftware kompatibel ist.

Dashboard

Ein Dashboard ist ein Tool zur Überwachung und Anzeige von Live-Daten. Dashboards sind in der Regel mit Datenbanken verknüpft und bieten Visualisierungen, die automatisch aktualisiert werden, um die aktuellsten Daten in der Datenbank anzuzeigen.

Datenanalytik

Datenanalytik ist die Erfassung, Transformation und Organisation von Daten, um Schlussfolgerungen zu ziehen, Vorhersagen zu treffen und fundierte Entscheidungen zu ermöglichen. Datenanalytik umfasst Datenanalyse (den Prozess der Informationsgewinnung aus Daten), Datenwissenschaft (die Nutzung von Daten zur Theoriebildung und Prognose) und Datentechnik (den Aufbau von Datensystemen). Data Analysts, Data Scientists und Data Engineers sind allesamt Datenanalytik-Experten.

Es gibt vier Haupttypen der Datenanalytik:

  • Deskriptive Analytik verrät, was passiert ist

  • Diagnostische Analytik verrät, warum etwas passiert ist

  • Prädiktive Analytik verrät, was wahrscheinlich in der Zukunft passieren wird

  • Präskriptive Analytik verrät, wie wir handeln sollen

Erfahren Sie mehr: Vertiefen Sie Ihre analytischen Fähigkeiten und treffen Sie wirkungsvolle Entscheidungen mit Kursen zur Datenanaltik.

Datenarchitektur

Datenarchitektur ist der Plan für das Datenmanagementsystem eines Unternehmens. Dies kann alle Berührungspunkte im Datenlebenszyklus umfassen, einschließlich der Erfassung, Organisation, Nutzung und Vernichtung der Daten. Datenarchitekten entwerfen Blueprints, die Unternehmen für ihre Datenmanagementsysteme verwenden.

Erfahren Sie mehr: Lernen Sie mit Kursen zur Datenarchitektur, effektive Datensysteme zu entwerfen und den Informationsfluss zu optimieren.

Datenbereinigung

Datenbereinigung ist der Prozess der Vorbereitung von Rohdaten für die Analyse. Beim Bereinigen Ihrer Daten stellen Sie sicher, dass diese korrekt, vollständig, konsistent und unvoreingenommen sind. Es ist wichtig, vor der Analyse saubere Daten zu haben, da unsaubere oder verfälschte Daten zu ungenauen Schlussfolgerungen und falschen Geschäftsentscheidungen führen können. 

Erfahren Sie mehr: Tauchen Sie mit Kursen zur Datenbereinigung tiefer in die Datenvorbereitung ein

Data Engineering

Data Engineering ist der Prozess, Daten für Analysen zugänglich zu machen. Data Engineers entwickeln Systeme, die Rohdaten sammeln, verwalten und in nutzbare Informationen umwandeln. Zu den häufigsten Aufgaben gehören die Entwicklung von Algorithmen zur Umwandlung von Daten in eine nützlichere Form, der Aufbau von Datenbank-Pipeline-Architekturen und die Entwicklung neuer Datenanalyse-Tools.

Erfahren Sie mehr: Erwerben Sie mit Data Engineering-Kursen wichtige Fähigkeiten zum Erstellen von Datenpipelines und -architekturen.

Data Enrichment

Bei der Datenanreicherung, auch Data Enrichment genannt, werden Daten zu Ihrem bestehenden Datensatz hinzugefügt. Normalerweise reichern Sie Ihre Daten während der Datentransformation an, wenn Sie sich auf die Analyse vorbereiten und feststellen, dass Sie zusätzliche Daten benötigen, um Ihre Geschäftsfrage zu beantworten.

Data Governance

Data Governance ist der formale Plan für die Verwaltung von Unternehmensdaten in einer Organisation. Data Governance umfasst Regeln für den Zugriff auf und die Nutzung von Daten und kann Verantwortlichkeits- und Compliance-Regeln beinhalten.

Erfahren Sie mehr: Meistern Sie die Strategien zur Verwaltung von Datenintegrität, Sicherheit und Compliance mit Data Governance-Kursen.

Datenintegrität

Datenintegrität umfasst die Genauigkeit, Zuverlässigkeit und Konsistenz von Daten im Laufe der Zeit. Sie beinhaltet die Aufrechterhaltung der Qualität und Zuverlässigkeit von Daten durch die Implementierung von Schutzmaßnahmen gegen unbefugte Änderungen, Fehler oder Datenverlust. 

Data Mining

Beim Data Mining werden Daten eingehend untersucht, um Muster zu erkennen und Erkenntnisse zu gewinnen. Data Mining ist ein zentraler Aspekt der Datenanalyse. Die dabei gewonnenen Erkenntnisse fließen in Ihre Geschäftsempfehlungen ein.

Erfahren Sie mehr: Schöpfen Sie das Potenzial von Big Data aus, indem Sie mit Data-Mining-Kursen Mustererkennung und Erkenntnisgewinnung meistern.

Data Science

Data Science ist die wissenschaftliche Untersuchung von Daten. Data Scientists stellen Fragen und finden Wege, diese Fragen mithilfe von Daten zu beantworten. Sie erfassen Daten, transformieren Rohdaten in eine nutzbare Form, analysieren Daten und erstellen prädiktive Modelle.

Erfahren Sie mehr: Entdecken Sie datengesteuerte Erkenntnisse und schaffen Sie Innovationen mit Data Science-Kursen.

Data Wrangling

Data Wrangling, auch Data Munging oder Data Remediation genannt, ist der Prozess der Umwandlung von Rohdaten in eine nutzbare Form. Der Munging-Prozess umfasst vier Phasen: Ermittlung, Datentransformation, Datenvalidierung und Veröffentlichung. Die Datentransformationsphase kann weiter in Aufgaben wie Datenstrukturierung, Datennormalisierung bzw. -denormalisierung, Datenbereinigung und Datenanreicherung unterteilt werden.

Erfahren Sie mehr: Verbessern Sie Ihre Fähigkeiten zur Datenmanipulation und optimieren Sie Ihren Analyseprozess mit Data Wrangling-Kursen.

Datenbank

Eine Datenbank ist eine organisierte Sammlung von Informationen, die durchsucht, sortiert und aktualisiert werden können. Diese Daten werden häufig elektronisch in einem Computersystem, einem sogenannten Datenbankmanagementsystem (DBMS), gespeichert. Für die Interaktion mit der Datenbank benötigen Sie häufig eine Programmiersprache wie SQL (Structured Query Language).

Erfahren Sie mehr: Meistern Sie die Kunst der Verwaltung und Optimierung von Datenbanken mit Kursen zur Datenbankverwaltung.

Datenquelle

Eine Datenquelle bezeichnet den Ursprung eines bestimmten Satzes von Informationen. Da Unternehmen Jahr für Jahr immer mehr Daten generieren, nutzen Datenanalysten verschiedene Datenquellen, um den Geschäftserfolg zu messen und strategische Empfehlungen abzugeben.

Datenvisualisierung

Datenvisualisierung ist die Darstellung von Informationen und Daten mithilfe von Diagrammen, Grafiken, Karten und anderen visuellen Hilfsmitteln. Mit aussagekräftigen Datenvisualisierungen können Sie das Storytelling fördern, Ihre Daten einem breiteren Publikum zugänglich machen, Muster und Zusammenhänge erkennen und Ihre Daten weiter erforschen.

Erfahren Sie mehr: Verwandeln Sie Daten mit Kursen zur Datenvisualisierung in überzeugende visuelle Geschichten.

Metadaten

Metadaten sind Daten über Daten. Sie beschreiben verschiedene Merkmale Ihrer Daten, z. B. wie sie erfasst wurden, wo sie gespeichert sind, ihren Dateityp oder das Erstellungsdatum. Metadaten können insbesondere für Verifizierungs- und Nachverfolgungszwecke nützlich sein.

Open Data

Open Data, auch offene Daten genannt, sind Daten, die jeder nutzen kann. Das Erkunden und Analysieren offener Datensätze ist eine Möglichkeit, Datenanalysefähigkeiten zu üben.

Qualitative Daten

Qualitative Daten beschreiben Eigenschaften oder Merkmale. Sie sind in der Regel nicht numerisch und können subjektiv sein, beispielsweise die Augenfarbe oder Emotionen.

Quantitative Daten

Quantitative Daten sind objektive Daten mit einem bestimmten numerischen Wert. Sie lassen sich in der Regel zählen oder messen, wie zum Beispiel Größe oder Geschwindigkeit.

Abfrage

Eine Abfrage ist eine Informationsanfrage. Im Wesentlichen handelt es sich dabei um die Frage, die Sie einer Datenbank stellen, um die gewünschten Daten abzurufen. In der Datenanalyse formulieren Sie Ihre Datenbankabfragen mithilfe einer Abfragesprache wie Structured Query Language (SQL). 

Relationale Datenbank

Eine relationale Datenbank enthält mehrere Tabellen mit zugehörigen Informationen. Obwohl die Daten in separaten Tabellen gespeichert sind, können Sie mit einer einzigen Abfrage auf zugehörige Daten aus mehreren Tabellen zugreifen. Beispielsweise kann eine relationale Datenbank eine Tabelle für Lagerbestände und eine andere für Kundenbestellungen enthalten. Wenn Sie in Ihrer relationalen Datenbank nach einem bestimmten Produkt suchen, können Sie sowohl Lagerbestands- als auch Kundenbestellinformationen gleichzeitig abrufen.

Saubere Daten

Saubere Daten sind präzise, ​​vollständig und bereit zur Analyse. Die Datenbereinigung, ein wichtiger Schritt im Datenanalyseprozess, umfasst die Überprüfung Ihrer Daten auf Ungenauigkeiten, Inkonsistenzen, Unregelmäßigkeiten und Verzerrungen.

Strukturierte Daten

Strukturierte Daten sind formatierte Daten, beispielsweise in Zeilen und Spalten organisierte Daten. Strukturierte Daten lassen sich aufgrund ihrer übersichtlichen Formatierung leichter analysieren als unstrukturierte Daten.

SQL

Structured Query Language (SQL, ausgesprochen „sequel“) ist eine Programmiersprache zur Verwaltung relationaler Datenbanken. Sie gehört zu den gängigsten Sprachen für die Datenbankverwaltung.

Erfahren Sie mehr: Entfesseln Sie die Leistungsfähigkeit der Datenbankverwaltung und Abfrageoptimierung mit SQL-Kursen.

Unstrukturierte Daten

Unstrukturierte Daten sind Daten, die nicht offensichtlich organisiert sind. Um unstrukturierte Daten analysieren zu können, müssen Sie in der Regel eine Organisation implementieren.

Sind Sie bereit, Ihre Datenanalyse-Fähigkeiten zu verbessern?

Verbessern Sie Ihre analytischen Fähigkeiten mit den verfügbaren Kursen zur Datenanalyse. Egal, ob Sie gerade erst anfangen oder Ihre Fähigkeiten verbessern möchten – diese Kurse vermitteln Ihnen die Tools und Erkenntnisse, die Sie für datenbasierte Entscheidungen benötigen. Nutzen Sie die Gelegenheit, Ihre Datenanalyse-Kompetenzen zu verbessern. Entdecken Sie Kurse, die Ihnen helfen können, Ihre Karriere und darüber hinaus maßgeblich zu beeinflussen. Starten Sie noch heute Ihr Lernabenteuer und verwandeln Sie Ihre Datenerkenntnisse in umsetzbare Ergebnisse.

Häufig gestellte Fragen zur Data Analysis Terms

Weiterlesen

Aktualisiert am
Geschrieben von:

Redaktion

Das Redaktionsteam von Coursera besteht aus äußerst erfahrenen professionellen Redakteuren, Autoren ...

Diese Inhalte dienen nur zu Informationszwecken. Den Lernenden wird empfohlen, eingehender zu recherchieren, ob Kurse und andere angestrebte Qualifikationen wirklich ihren persönlichen, beruflichen und finanziellen Vorstellungen entsprechen.