Erstellen Sie mit diesen fünf anfängerfreundlichen Data Analytics Projects ein berufsreifes Portfolio.
Read in English (Auf Englisch lesen).
Wenn Sie sich auf eine neue Karriere als Datenanalyst vorbereiten, stehen Sie wahrscheinlich vor einem altbekannten Dilemma. Stellenausschreibungen verlangen Erfahrung, aber wie sammelt man diese, wenn man seinen ersten Job als Datenanalyst sucht? Hier kommt Ihr Datenanalysten-Portfolio ins Spiel.
Die Data Analytics Projects in Ihrem Portfolio demonstrieren Personalverantwortlichen und Interviewern Ihre Fähigkeiten und Erfahrungen – auch wenn diese nicht aus einer früheren Tätigkeit im Bereich Datenanalyse stammen. Die richtigen Projekte in Ihrem Portfolio können Ihr Vertrauen stärken, dass Sie die richtige Person für die Stelle sind, auch ohne vorherige Berufserfahrung.
In diesem Artikel besprechen wir fünf Arten von Projekten, die Sie in Ihr Portfolio aufnehmen sollten, insbesondere wenn Sie gerade erst anfangen. Sie haben noch keins? Mit dem Google Datenanalyse-Zertifikat weisen Sie Ihre Kompetenz in portfolioreifen Projekten nach, um Ihre Arbeit zukünftigen Arbeitgebern zu präsentieren.
Als angehender Datenanalyst sollten Sie in Ihrem Portfolio einige Schlüsselkompetenzen nachweisen. Diese Projektideen zur Datenanalyse spiegeln die Aufgaben wider, die für viele Datenanalystenrollen oft grundlegend sind.
Obwohl es im Internet zahlreiche hervorragende (und kostenlose) öffentliche Datensätze gibt, möchten Sie potenziellen Arbeitgebern zeigen, dass Sie auch Ihre eigenen Daten finden und scrapen können. Wenn Sie wissen, wie man Webdaten scrapt, können Sie Datensätze finden und nutzen, die Ihren Interessen entsprechen, unabhängig davon, ob diese bereits zusammengestellt wurden oder nicht.
Wenn Sie Python beherrschen, können Sie Tools wie Beautiful Soup oder Scrapy nutzen, um das Web nach interessanten Daten zu durchsuchen. Wenn Sie nicht programmieren können, ist das kein Problem. Es gibt auch verschiedene Tools, die den Prozess automatisieren (viele bieten eine kostenlose Testversion an), wie Octoparse oder ParseHub.
Wenn Sie nicht sicher sind, wo Sie anfangen sollen, finden Sie hier einige Websites mit interessanten Datenoptionen, die Sie für Ihr Projekt inspirieren können:
Wikipedia
Jobportale
Beispiel für ein Web-Scraping-Projekt: Todd W. Schneider von Wedding Crunchers hat rund 60.000 Hochzeitsanzeigen der New York Times aus den Jahren 1981 bis 2016 durchsucht, um die Häufigkeit bestimmter Ausdrücke zu messen.
Tipp: Beachten Sie beim Scrapen von Daten aus dem Internet stets die Nutzungsbedingungen der jeweiligen Website. Beschränken Sie Ihre Scraping-Aktivitäten, um die Server des Unternehmens nicht zu überlasten, und geben Sie bei der Präsentation Ihrer Datenergebnisse in Ihrem Portfolio stets Ihre Quellen an.
Möchten Sie wissen, wie Arbeitgeber Datenanalysten sehen? In dieser Vorlesung zum Datenanalyse.Zertifikat von Google erfahren Sie mehr darüber, wie Personalverantwortliche Datenanalysten und ihre Portfolios bewerten:
Ein wesentlicher Teil Ihrer Aufgabe als Datenanalyst besteht darin, Daten zu bereinigen, um sie für die Analyse vorzubereiten. Datenbereinigung (auch Datenscrubbing genannt) ist der Prozess, fehlerhafte und doppelte Daten zu entfernen, Datenlücken zu schließen und eine konsistente Formatierung sicherzustellen.
Wenn Sie nach einem Datensatz für die Bereinigung suchen, achten Sie darauf, dass er mehrere Dateien aus verschiedenen Quellen enthält, die nicht umfassend kuratiert wurden. Einige Websites, auf denen Sie „schmutzige“ Datensätze finden, mit denen Sie arbeiten können, sind:
CDC-Wunder
Data.gov
Weltbank
Datenwelt
/r/Datensätze
Beispiel für ein Datenbereinigungsprojekt: Dieser Artikel beschreibt, wie der Datenanalyst Raahim Khan eine Reihe täglich aktualisierter Statistiken zu trendigen YouTube-Videos bereinigt hat.
Erfahren Sie mit dem Meta Data Analyst Professional Certificate, wie Sie Daten sammeln, bereinigen, sortieren, auswerten und visualisieren können.
Bei der Datenanalyse geht es darum, Fragen mit Daten zu beantworten. Explorative Datenanalyse, kurz EDA, hilft Ihnen dabei, die richtigen Fragen zu finden. Dies kann unabhängig oder in Verbindung mit der Datenbereinigung erfolgen. In jedem Fall sollten Sie während dieser frühen Untersuchungen Folgendes erreichen:
Stellen Sie viele Fragen zu den Daten.
Entdecken Sie die zugrunde liegende Struktur der Daten.
Suchen Sie in den Daten nach Trends, Mustern und Anomalien.
Testen Sie Hypothesen und validieren Sie Annahmen über die Daten.
Überlegen Sie, welche Probleme Sie mit den Daten möglicherweise lösen könnten.
Beispiel für ein exploratives Datenanalyseprojekt: Dieser Datenanalyst nahm 2013 einen vorhandenen Datensatz zu amerikanischen Universitäten von Kaggle und nutzte ihn, um zu untersuchen, warum Studenten eine bestimmte Universität einer anderen vorziehen.
10 kostenlose öffentliche Datensätze für EDA
Ein EDA-Projekt bietet eine hervorragende Gelegenheit, die Fülle öffentlicher Datensätze online zu nutzen. Hier sind 10 unterhaltsame und kostenlose Datensätze, die Ihnen den Einstieg erleichtern.
1. Deutscher Wetterdienst: Entdecken Sie Deutschlands größten Anbieter von Wetter- und Klimadaten.
2. World Happiness Report 2024: Was macht die glücklichsten Länder der Welt so glücklich?
3. NASA: Wenn Sie sich für Weltraum- und Geowissenschaften interessieren, sehen Sie sich an, was Sie unter den Zehntausenden öffentlich zugänglichen Datensätzen finden können, die von der NASA zur Verfügung gestellt werden.
4. Zensus Datenbank: Erfahren Sie mehr über die Bevölkerung und die Wirtschaft Deutschlands mit den Ergebnissen des Zensus aus dem Jahr 2022.
5. Bundeskriminalamt: Erkunden Sie Kriminalitätsdaten in Deutschland.
6. COVID-19-Zahlen weltweit: Verfolgen Sie die neuesten Coronavirus-Zahlen nach Land.
7. Neueste Netflix-Daten: Dieser Kaggle-Datensatz (aktualisiert im April 2021) enthält Filmdaten, die in 26 Attribute unterteilt sind.
8. Google Books Ngram: Laden Sie die Rohdaten von Google Books Ngram herunter, um Phrasentrends in Büchern zu erkunden, die zwischen 1800 und 2022 veröffentlicht wurden.
9. NYC Open Data: Entdecken Sie New York City anhand der zahlreichen öffentlich verfügbaren Datensätze zu Themen wie der Eichhörnchenpopulation im Central Park und Autounfällen.
10. Yelp Open Dataset: Sehen Sie, was Sie finden können, wenn Sie diese Sammlung von Yelp-Benutzerbewertungen, Check-ins und Geschäftsattributen erkunden.
Die Sentimentanalyse, die typischerweise auf Textdaten angewendet wird, ist eine Technik der natürlichen Sprachverarbeitung (NLP), um zu bestimmen, ob Daten neutral, positiv oder negativ sind. Sie kann auch verwendet werden, um eine bestimmte Emotion anhand einer Liste von Wörtern und den dazugehörigen Emotionen (bekannt als Lexikon) zu erkennen.
Diese Art der Analyse eignet sich gut für öffentliche Bewertungsseiten und Social-Media-Plattformen, auf denen Menschen häufig ihre öffentliche Meinung zu verschiedenen Themen äußern.
Um herauszufinden, was die Leute zu einem bestimmten Thema denken, können Sie mit Websites wie diesen beginnen:
Amazon (Produktbewertungen)
Rotten Tomato (Filmkritiken)
Nachrichtenseiten
Beispielprojekt zur Stimmungsanalyse: Dieser Blogbeitrag auf Medium beschreibt detailliert, wie ein Unternehmensanalyst Python verwendet, um mithilfe von NLP eine Stimmungsanalyse von Produktbewertungen durchzuführen.
Erfahren Sie von Google selbst im kurzen, interaktiven Projekt Entitäten- und Sentimentanalyse mit der Natural Language API, wie Sie Google Cloud für die Stimmungsanalyse verwenden können.
Der Mensch ist ein visuelles Wesen. Daher ist Datenvisualisierung ein leistungsstarkes Tool, um Daten in eine fesselnde Geschichte zu verwandeln und zum Handeln anzuregen. Tolle Visualisierungen machen nicht nur Spaß, sondern verleihen Ihrem Portfolio auch ein ansprechendes Aussehen.
Beispiel eines Datenvisualisierungsprojekts: Die Datenanalystin Hannah Yan Han visualisiert das erforderliche Fähigkeitsniveau für 60 verschiedene Sportarten, um zu bestimmen, welche die härtesten sind.
Fünf kostenlose Tools zur Datenvisualisierung
Sie müssen auch keine teure Visualisierungssoftware kaufen, um beeindruckende Visualisierungen zu erstellen. Dies sind nur einige der kostenlosen Visualisierungstools, mit denen Sie Geschichten mit Daten erzählen können:
1. Tableau Public: Tableau zählt zu den beliebtesten Visualisierungstools. Nutzen Sie die kostenlose Version, um Tabellen oder Dateien in interaktive Visualisierungen umzuwandeln (hier einige Beispiele vom April 2021).
2. Google Charts: Diese Galerie mit interaktiven Diagrammen und Datenvisualisierungstools erleichtert das Einbetten von Visualisierungen in Ihr Portfolio mithilfe von HTML- und JavaScript-Code. Ein ausführlicher Anleitungsbereich führt Sie durch den Erstellungsprozess.
3. Datawrapper: Kopieren Sie Ihre Daten aus einer Tabellenkalkulation oder laden Sie eine CSV-Datei hoch, um Diagramme, Karten oder Tabellen zu erstellen – ganz ohne Programmierkenntnisse. Mit der kostenlosen Version können Sie unbegrenzt viele Visualisierungen erstellen und als PNG-Dateien exportieren.
4. D3 (Data-Driven Documents): Mit ein wenig technischem Know-how können Sie mit dieser JavaScript-Bibliothek eine Menge erreichen.
5. RAW Graphs: Diese Open-Source-Webanwendung ermöglicht die einfache Umwandlung von Tabellenkalkulationen oder CSV-Dateien in verschiedene Diagrammtypen, die sonst nur schwer zu erstellen wären. Die App bietet sogar Beispieldatensätze zum Experimentieren.
Bonus: End-to-End-Projekt
Es ist nichts falsch daran, Ihr Portfolio mit Miniprojekten zu füllen, die individuelle Fähigkeiten hervorheben. Wenn Sie jedoch im Internet nach Ihren eigenen Daten gesucht haben, können Sie diese auch für ein umfassendes Projekt nutzen. Nehmen Sie dazu die gesammelten Daten und wenden Sie die wichtigsten Schritte der Datenanalyse an: Bereinigen, Analysieren und Interpretieren.
Damit können Sie einem potenziellen Arbeitgeber zeigen, dass Sie über die wesentlichen Fähigkeiten eines Datenanalysten verfügen und wissen, wie diese zusammenpassen.
Abonnieren Sie den Karriere-Chat auf LinkedIn
Wir haben einen Newsletter zum Thema Datenanalyst werden veröffentlicht. Abonnieren Sie ihn, um mit dem Karriere-Chat die neuesten Karrieretipps zu erhalten.
Eine weitere hervorragende Möglichkeit, portfolioreife Projekte zu erstellen, ist projektbasiertes Online-Lernen. Hier sind einige der am häufigsten empfohlenen Kurse auf Coursera:
Schließen Sie Projekte ab und erweitern Sie Ihr Portfolio mit dem Google Datenanalyse-Zertifikat Nach Abschluss des Programms erhalten Sie außerdem Zugriff auf Karriereressourcen.
Vertiefen und demonstrieren Sie Ihre Python-Kenntnisse mit der Spezialisierung Python für alle der University of Michigan.
Üben Sie mit dem Microsoft Power BI Datenanalyse-Zertifikat die Verwendung von Power BI, einem gängigen Datenanalysetool, mit dem Sie Daten mithilfe von benutzerdefinierten Berichten und Dashboards in Erkenntnisse umwandeln können.
Es gibt viele gute Bücher für diejenigen, die gerade erst mit der Datenanalyse beginnen. Insbesondere die folgenden drei Bücher bieten zugängliche Einführungen in die wichtigsten Aspekte des Fachgebiets: Daten- und Prozessanalyse für Fachinformatiker*innen von Sascha Kersken, Datenwissenschaft in der Praxis von Tom Alby und Einstieg in Datenwissenschaft mit R von Benjamin Matuzak.
Zur Ergänzung der Lektüre können Anfänger auch den Online-Kurs Python für alle belegen, der von der University of Michigan angeboten und von Dr. Severance selbst unterrichtet wird.
Datenvisualisierung ist der Prozess der grafischen Darstellung von Daten mit visuellen Mitteln. Zu den gängigen Formen der Datenvisualisierung gehört die Verwendung von Grafiken, Diagrammen und Schaubildern zur visuellen Darstellung ansonsten abstrakter Datensätze. Die Datenvisualisierung gilt heute als eine der Schlüsselqualifikationen in der Welt der Datenanalyse.
Angehende Datenanalysten sollten sicherstellen, dass sie über ein solides technisches Verständnis von Structured Query Language (SQL), Microsoft Excel und entweder R oder Python verfügen. Außerdem sollten sie in der Lage sein, kritisch zu denken, selbstbewusst zu präsentieren und zu wissen, wie sie die Geschichte ihrer Daten visuell erzählen können.
Redaktion
Das Redaktionsteam von Coursera besteht aus äußerst erfahrenen professionellen Redakteuren, Autoren ...
Diese Inhalte dienen nur zu Informationszwecken. Den Lernenden wird empfohlen, eingehender zu recherchieren, ob Kurse und andere angestrebte Qualifikationen wirklich ihren persönlichen, beruflichen und finanziellen Vorstellungen entsprechen.