Von Data Science bis Cloud Engineering – die Berufswelt des Datadriven Advertising

Data Science, Data Engineering, Machine Learning, Cloud Engineering – diese Begriffe sind die Basis des Datadriven Advertising. In diesem Blogartikel gehen wir ihnen auf den Grund und zeigen welche Skills dahinterstecken.

(c) Unsplash

Data Science

Data Science entwickelte sich aus der statistischen Modellierung und Datenanalyse und ist stark in Disziplinen wie Mathematik, Statistik, Advanced Analysis und Machine Learning verwurzelt. Das interdisziplinäre Feld nutzt wissenschaftlich fundierte Methoden, Prozesse, Algorithmen und Systeme zur Extraktion von Erkenntnissen, Mustern und Schlüssen sowohl aus strukturierten als auch aus unstrukturierten Daten.

Data Science ist fokussiert auf das Extrahieren von nützlichen Informationen aus Datensätzen!

Die Aufgaben des Data Scientists

Die / der Data Scientist übersetzt wirtschaftliche Fragen in die Sprache der Informatik und Mathematik. Mittels Machine Learning und Predictive Analysis werden aus zusammengesetzten Datensätzen nützliche Informationen extrahiert. Die Aussagen dienen als Erkenntnisse bzw. Vorhersagen und sind Entscheidungshilfe oder -grundlage für wichtige unternehmerische Fragestellungen.

Kernkompetenzen eines Data Scientists

Data Scientists sind in der Welt der Statistik, Wahrscheinlichkeitsrechnung, Mathematik und Algorithmen zuhause.  Um Programme zu trainieren, und Analysen zu erstellen sind Programmierkenntnisse notwendig. Eine verbreitete Programmiersprache in Data Science ist “R” welche für statistische Berechnungen entwickelt wurde.

Was macht einen Data Scientist aus?

Die Merkmale einer / eines Data Scientists sind vielfältig. Dazu gehören jedenfalls:

  • Technische Expertise: die besten Data Scientists haben eine tiefgehende Expertise in einer wissenschaftlichen Disziplin
  • Neugier: sie haben einen Drang unter die Oberfläche zu tauchen und Problemen auf den Grund zu gehen, um dann eine Hypothese aufzustellen, die getestet werden kann
  • Storytelling: die Fähigkeit ihre Ergebnisse effektiv zu kommunizieren und Daten für Storytelling zu nutzen
  • Cleverness: die Fähigkeit Probleme von einer anderen, kreativen Seite zu beleuchten

Data Scientists müssen nicht zwingend aus der IT oder Informatik kommen! Naturwissenschaftliche Fachbereiche wie zB Chemie, Physik, Meeresbiologie usw. sind optimal, da das Mindset der Forschung auch auf Data Science anwenden lässt.

Data Engineering

Data Engineering gilt als Teilbereich von Data Science. Die grundsätzlichen Aufgaben von Data Engineering sind das Sammeln, Aufbereiten und Validieren von Daten.

Die Aufgaben des Data Engineer

Data Engineers stehen vor der Herausforderung, Daten sowohl aus strukturierten als auch unstrukturierten Systemen auf fehlende Felder, mismatched Datentypen und andere Daten-relevante Probleme zu überprüfen und die Daten zu bereinigen. Anders als bei den Data Scientists, haben Data Engineers typischerweise einen Programmier-Background, meistens in Java, Scala oder Python.

Kernkompetenzen eines Data Engineers

Die Programmierkenntnisse werden genutzt, um Daten zu bereinigen und an ein System zu übergeben. Diese Daten ermöglichen es dem Data Scientist dann, Analysen und Hypothesen zu erstellen, sowie Datenmodelle anzuwenden.

Data Engineers designen, entwerfen und arrangieren Daten zur weiteren Analyse.

Data Science vs. Data Engineering – eine Abgrenzung

  • Der Fokus von Data Engineers liegt auf dem Bilden der Infrastruktur, Architektur und Datengenerierung.
  • Der Fokus bei Data Scientists liegt auf fortgeschrittenen mathematischen Methoden und statistischen Analysen an diesen generierten Daten.

Damit sind Data Scientists kontinuierlich mit der Dateninfrastruktur beschäftigt, aber nicht für den Aufbau und die Instandhaltung dieser Infrastruktur verantwortlich – diese Verantwortung fällt in den Aufgabenbereich der Data Engineers. Diese bilden skalierbare, höchst leistungsfähige Infrastrukturen, welche Business Insights durch Rohdaten-Quellen ermöglichen. Sie implementieren damit komplexe analytische Projekte mit dem Fokus, dass diese Daten in weiterer Folge von Data Scientists aufgegriffen werden können.

Vereinfacht gesagt, kann man damit zusammenfassen, dass Data Scientists auf die Arbeit von Data Engineers angewiesen sind, da ihre Arbeit auf die Vorbereitung durch Data Engineers aufbaut und in weiterer Folge das Anwenden von fortgeschrittenen, automatisierten und maschinellen Methoden ermöglicht.

Data Scientists beschäftigen sich mit Analysetechniken wie R, SPSS, Hadoop, und fortgeschrittenen statistischen Modellen. Data Engineers hingegen fokussieren sich auf Produkte die die Anwendung dieser Techniken ermöglichen – bspw. SQL, MySQL, NoSQL, Cassandra, und weitere Services zum Organisieren von Daten.

Beide Skillsets sind notwendig und bilden damit ein Data-Team, dass die Arbeit mit “Big Data” ermöglicht. 

Data Scientist vs Data Engineer

Machine Learning Engineer

Um diese Lücke (s. Bild oben) zwischen dem akademischen Mindset und dem Need etwas Handfestes herzustellen zu füllen, entwickelt sich zurzeit ein neuer Typus von Engineers. Dieser ist meist in den USA vorzufinden. Der Titel dieser Profession lautet: Machine Learning Engineer.

Machine Learning Engineer

Machine Learning Engineers kommen meist aus einem Data Engineering Background. Sie kennen sowohl die Welt der Data Scientists, als auch die der Data Engineers und können Kenntnisse beider Bereiche vorweisen. Damit ist ein Machine Learning Engineer die verbindende Position zwischen Data Science und Data Engineering.

Die Aufgaben des Machine Learning Engineers

Die Aufgabe von Machine Learning Engineers besteht darin, die Erkenntnisse von Data Scientists zu verwenden und damit etwas Handfestes umzusetzen bzw. zu produzieren. Ein Machine Learning Engineer hat genug Engineering Kenntnisse, um hier anzusetzen und den letzten Schritt des Projekts zu verwirklichen.

Aus Data Engineers können Machine Learning Engineers werden, allerdings braucht diese Entwicklung Zeit. Außerdem benötigen sie relevante Mathematik und Statistik-Kenntnisse und Erfahrung.

Data Architect

Data Architekten haben die Aufgabe Ordnung in das Datenchaos zu bringen. Dazu designen Data Architekten eine Art “Blueprint” für das Daten Management von Organisationen und Unternehmen. Jedes Data Science Team benötigt einen Data Architekten zum Visualisieren, Designen und Vorbereiten eines Daten Frameworks, das dann in weiterer Folge von Data Scientists, Engineers oder Data/Web Analysten genutzt werden kann.

Die Aufgaben des Data Architects

Data Engineers unterstützten Data Architects beim Bilden eines Frameworks für Data Search und Datenabfragen, welche Data Scientists und Analysten dann weiter für ihre Arbeit nutzen können.

Die größten Unterschiede zwischen Data Architekten und Data Engineers sind:

  • Data Architekten konzipieren und visualisieren Data Frameworks; Data Engineers erstellen und verwalten diese.
  • Data Architekten leiten und führen das Data Science Team, während Data Engineers für das unterstützende Framework sorgen, um diese Tasks möglich zu machen
  • Früher haben Data Architekten die Arbeit von Data Engineers übernommen, heutzutage hat sich das Berufsbild verändert und sich den Gegebenheiten angepasst.
  • Obwohl Data Architekten und Data Engineers beide enorme Kenntnisse im Bereich des Database Managements vorweisen können, nutzen beide Rollen ihre Kenntnisse auf unterschiedliche Weise.

Cloud Engineering

Die Aufgaben des Cloud Engineers

Cloud Engineers sind dafür verantwortlich, Business Infrastrukturen und diverse Funktionen in Cloud-basierte Systeme zu migrieren. Sie erstellen, verwalten und verlinken Cloud Services und verbinden sowohl technische Skills als auch Business-Wissen und Erfahrungen mit mindestens einem großen Cloud Provider, wie etwa: Amazon Web Services, Microsoft Azure und Google Cloud Platform.

Sie beurteilen existierende Infrastrukturen und suchen nach Lösungen und setzen unterschiedliche Funktionen ( wie etwa die Database Storage) in Cloud-basierten Systemen um. Dafür benötigen sie neben technischen Skills, auch die Fähigkeit Vertragsbedingungen mit Anbietern zu verhandeln, die Sicherheit von Daten zu gewährleisten und neue Praktiken in einem Prozess zu implementieren.

Kernkompetenzen eines Cloud Engineers

  • OpenStack, Linux, Amazon Web Services, Rackspace, Google compute engine, Microsoft Azure and Docker (mindestens eines dieser)
  • Web Services, API, REST, RPC. Cloud Architekturen basieren auf APIs und Web Services
    Virtualisieren, Datenspeicherung und Networking
  • Neben technischen Fähigkeiten auch Business Use Case-Wissen
  • Programmiersprachen wie Java, Python and Ruby. Viele Unternehmen suchen bei Cloud Engineers auch nach Erfahrungen mit APIs, Orchestrierungen, Automatisierung, DevOps und Databases wie NoSQL

Cloud Architect

Ein Cloud Architekt ist eine IT-Fachperson, die verantwortlich für die gesamte Unternehmens-Cloud-Computing- Strategie ist. Dazu gehören Tasks wie die Cloud-Einführung, Cloud Application Design sowie Cloud Management und Monitoring. Zudem sind sie Consultants und müssen auf dem neusten Stand über die Entwicklungen in ihrem Bereich bleiben.

Kernkompetenzen eines Cloud Architect

  • Starkes Verständnis für Cloud Computing Technologien und Infrastrukturen
  • Erfahrung mit dem Designen und Migrieren von Applikationen in die Cloud
  • Consultant Skills, da sie auch Kundenbeziehungen pflegen
  • Erfahrungen mit mehreren Programmiersprachen wie etwa: Java, Node.js, PHP, Python, Ruby on Rails
  • Cloud Architekten können auch in den Legal-Bereich des Cloud Computings eingebunden werden und Verträge aushandeln

Sie möchten Teil unseres Data Teams werden oder sind interessiert an den vielseitigen Einsatzmöglichkeiten von Data Science & Machine Learning in Ihrem Unternehmen? Werfen Sie einen Blick auf unsere Jobseite und kontaktieren Sie uns gerne!

Hinterlassen Sie einen Kommentar: