Die bunte Welt der Data Scientists

06. November 2018 Peter Schneider – Wissen

Was ist ein Data Scientist?

Die Digitalisierung macht auch vor der Werbung nicht halt, im Gegenteil: mit zunehmender Rechenleistung und einer stetig zunehmenden Flut von Informationen in digitaler Form, kommen die Jongleure und Domteure großer Datenmassen ins Spiel – die Data Scientists. Doch was oder wer ist ein Data-Scientist? Wie häufig, hilft ein Blick in die Wikipedia für eine erste Orientierung. Die beschreibt das Themenfeld wie folgt:

Data Science ist ein interdisziplinäres Wissenschaftsfeld, welches wissenschaftlich fundierte Methoden, Prozesse, Algorithmen und Systeme zur Extraktion von Erkenntnissen, Mustern und Schlüssen sowohl aus strukturierten als auch unstrukturierten Daten ermöglicht.

Der Studiengang Data Science verwendet Techniken und Theorien aus den Fächern Mathematik, Statistik und Informationstechnologie, einschließlich der Signalverarbeitung, verwendet Wahrscheinlichkeitsmodelle, des maschinellen Lernens, des statistischen Lernens, der Programmierung, der Datentechnik, der Mustererkennung, der Prognostik, der Modellierung von Unsicherheiten und der Datenlagerung.

Quelle: wikipedia.de

Infografik Data Science

Data Scientist: The sexiest job of the 21st Century

Im Harvard Business Review von Oktober 2012 wurde der Data Scientist als „The sexiest job of the 21st Century“ bezeichnet. Im gleichen Artikel stellten sich die Autoren auch die Frage, welche Art von Menschen all das in einer Person vereinen? Und welche Fähigkeiten machen einen Data Scientisten wirklich erfolgreich? „Stellen Sie ihn sich als einen Mix aus Hacker, Analysten, Kommunikator und vertrauenswürdigem Berater vor. Eine extrem mächtige, aber auch sehr seltene Kombination“, so die Autoren. 

Was sollte eine Data Scientist an Fähigkeiten mitbringen?

Wer sich mit Mathematik, Statistik und Informatik schon in der Schule schwer getan hat, sollte sich besser auf andere Berufsfelder fokussieren. Das strukturierte und systematische Arbeiten ist eine Grundvoraussetzung im Umgang mit großen Datenmengen und komplexen Analysemodellen.

Ein guter Data Scientist muss kreativ sein

Aber ein leidenschaftlicher Data Scientist zeichnet sich darüber hinaus noch durch eine Menge weiterer Eigenschaften aus. Zwei dieser Eigenschaften sind Neugier und Kreativität. Ein Widerspruch zu dem mathematisch, analytisch geprägten Bild, das die obige Definition zeichnet? 

Keinesfalls, findet Peter Lipp, einer der Data Scientisten von Direct Analytics, der Analyse-Schwesterfirma der AZ Direct. „Ein guter Data Scientist hat Spaß daran, Zusammenhänge aufzudecken, die man auf den ersten Blick nicht sieht und auch nicht vermutet. Wenn wir mit den Kollegen aus dem Vertrieb Daten für Kunden analysieren und unsere Ergebnisse diesem anschließend präsentieren, ist mein Ziel immer, ihm ein „Das hätte ich nicht gedacht“ zu entlocken. 

Bis dahin ist es jedoch oft ein langer Weg. Häufig scheinen Ergebnisse auf den ersten Blick verführerisch logisch, auf den zweiten Blick hält diese Logik jedoch einer Überprüfung nicht stand.  

„Man muss kritisch auch gegenüber den eigenen Ergebnissen bleiben“, so Lipp weiter. „Häufig sind die Zusammenhänge nicht so offensichtlich wie vermutet“. Sich und seine Arbeit zu hinterfragen und die Meinung der Kollegen einzuholen steigert die Qualität der Arbeit. Unter Umständen danach auch wieder von vorne beginnen zu müssen, erfordert eine gewisse Frustrationstoleranz.

Wichtig für einen Data Scientisten ist die permanente Suche nach Zusammenhängen. Merkmale werden neu kombiniert und in Beziehung zueinander gesetzt. Dazu ist ein fundiertes, statistisches Wissen um Methoden und Modelle unverzichtbar.  

Daten, Zahlen, Fakten in spannende Stories verpacken

Doch mit dem Blick auf das Berufsbild kommen noch weitere Eigenschaften zum Tragen, die einen erfolgreichen Data Scientist ausmachen. Nämlich die Fähigkeit, die gewonnenen Erkenntnisse in eine verständliche Sprache, in Bilder und Stories zu übersetzen und damit Zahlen, Daten und Fakten begreifbar für den Adressaten zu machen. „Die besten Ergebnisse helfen nicht weiter, wenn man den Mehrwert der Analyseergebnisse nicht aufzeigen kann“, sagt Kirsten Haacke, die ebenfalls als Data Scientist bei der Direct Analytics arbeitet. Dazu ist es nötig, die Strategien seines Kunden zu kennen, die Ergebnisse der Analyse darin einzupassen und die relevanten Erkenntnisse in eine spannende Story zu verpacken. 

„Wenn man schon so viele Analyse-Projekte wie wir hier durchgeführt hat“, so Haacke, „dann kennt man die Winner-Modelle und gibt diese Erfahrungen gerne als Consultant weiter.“ Analyseergebnisse stellen immer auch Strategien der Unternehmen auf den Prüfstand und das kann weitreichende Veränderungen nach sich ziehen. Gerade bei datengetriebenen Strategieanpassungen kann ein Consultant aus dem Bereich Data Scientist als Sparringpartner mehr als nützlich sein. In der Regel kennt er sich in verschiedenen Branchen gut aus, hat sich die ‚best practice-Modelle‘ angeeignet und kennt das Arbeiten in interdisziplinären Teams. Diesen Erfahrungsschatz zu nutzen, kann ein Projekt nur beschleunigen. 

Als fachliche Grundvoraussetzungen sind neben den statistischen Modellen und Methoden wie zum Beispiel multivariate Anaylseverfahren auch Kenntnisse in relevanten Programmiersprachen wie R und Phyton sowie Datenbankwissen erforderlich. SQL, Hadoop und Oracle sind hier die gängigsten Themen. 

Der Detektiv am Rechner

„Ich sehe mich als eine Art moderner Sherlock Holmes, der interessante Profile für seine Kunden aufdeckt. Die Spuren die ich untersuche sind digital und mein Werkzeug ist keine Lupe sondern Algorithmen und superschnelle Computer“, schmunzelt Peter Lipp. Konsequenterweise haben Data Scientisten auch eine hohe Affinität zu Strategiespielen und Simulationen. Szenarien zu durchdenken und die Zusammenhänge zu verstehen hilft eben nicht nur im Job.

Einen Tipp für angehende Data Scientists hat Peter Lipp noch parat: „Wer später als Data Scientist arbeiten möchte, sollte sich schon während des Studiums um relevante Praktika bemühen, sich in Big Data Projekten an der Universität engagieren oder Hackathons besuchen. 

Wer sich für das Berufsfeld des Data Scientisten interessiert sollte die Liste der Anforderungen mit den eigenen Interessen und Eigenschaften abgleichen:

  • Mathematisch interessiert
  • Kommunikativ
  • Investigativ
  • Kritisch
  • Analytisch
  • Kreativ
  • Interdisziplinär

Trifft das auf Sie und ihre Präferenzen zu? Dann sollten Sie das Berufsbild als Alternative für sich in Erwägung ziehen.

Fazit:

Das Berufsbild des Data Scientist ist spannend und vielfältig. Neben einer hohen fachlichen Kompetenz, sind Neugier und Kreativität integrale Bestandteile des Berufsbildes. Data Scientists sind häufig interdisziplinär aktiv, sollten kommunikativ und überzeugend sein. Ein durchaus bunter Mix, finden Sie nicht auch?

Peter Schneider