Wenn alte Hasen Data Scientist werden

Ein Erfahrungsbericht

Dieser Artikel beschreibt die Geschichte eines erfahrenen Diplom-Technomathematikers, der aktuell an einem Online-Training zum Data Scientist teilnimmt. Er erklärt, worauf es bei einer solchen Weiterbildung ankommt und teilt seine Erfahrungen.
gulp personaldienstleistung - freelancer - steuertipps

Wenn alte Hasen Data Scientist werden

Ein Erfahrungsbericht

Maria Poursaiadi und Ulrich Seidel – GULP Redaktion
Dieser Artikel beschreibt die Geschichte eines erfahrenen Diplom-Technomathematikers, der aktuell an einem Online-Training zum Data Scientist teilnimmt. Er erklärt, worauf es bei einer solchen Weiterbildung ankommt und teilt seine Erfahrungen.

Der Mensch muss Friedrich Schiller zufolge streben und wirken. Er beschäftigt sich immerzu mit der Frage nach dem nächsten Sinn und Zweck seines Handelns. Ist es da verwunderlich, dass auch im 21. Jahrhundert der Weiterbildung eine herausragende Bedeutung zukommt? Selbst dann, wenn die Öffentlichkeit sich seit – gefühlt – mehr als einem Jahr nur mit einem Thema beschäftigt: Der Pandemie.

Von solch einem strebsamen Menschen, der sich auf zu neuen Ufern macht und dadurch nicht nur positives Feedback sondern auch neue Perspektiven, Motivation, Zufriedenheit und Freude erlebt, soll dieser Artikel berichten.

Per Infoletter vom Data Awareness Kurs erfahren

Ulrich Seidel hat Diplom-Technomathematik studiert – eine Kombination aus klassischer Mathematik mit einem Ingenieurfach und Angewandter Informatik – und ist mit seinen über 20 Jahren Berufserfahrung bereits ein alter Hase. Als Software-Tester war er in den unterschiedlichsten Bereichen unterwegs: E-Commerce, Low Code, Abrechnungssysteme und Logistik. Das Verbindende waren stets das Testen, Dokumentieren und der Support. Spannende, wichtige und nützliche Themen, keine Frage. Wie aber kann die Brücke geschlagen werden von diesem vertrauten Terrain hin zu den vielzitierten Zukunftstechnologien? Was hat die «Modellbildung und Simulation» von damals zu tun mit heutigen disruptiven Prozessen, Big Data und Künstlicher Intelligenz?

Der Impuls, dieser Frage nachzugehen, ging aus vom GULP Know-how & News Infoletter. Dort war zu lesen: «Die KI (englisch AI) wird zum festen Bestandteil vieler Anwendungen und neuer Techniken, auch in der Industrie und im Büroalltag. Wer hier keinen Trend verschlafen möchte, sollte die vielen nationalen und internationalen Konferenzen, Workshops und Events nutzen.» Eine Woche später hatte sich Seidel angemeldet zum Basiskurs Data Awareness.

Im Online Training erfuhr er einiges über die Einsatzmöglichkeiten der Datenanalyse, etwa in der Fertigungstechnik durch Sensorik, im Vertragswesen durch Auswertung von Schlüsselwörtern oder beim Autonomen Fahren mittels Bilderkennung. All diese Technologien, von denen er bislang nur gehört hatte, wurden auf einmal greifbar. Der Kurs beschrieb in anschaulicher Weise den Zusammenhang zwischen steigender Datenfülle, die Erschliessung mittels Datenanalyse und ihre Anwendung für reale Geschäftsprozesse. «Die praxisnahen Beispiele und die ansprechende Gestaltung mit dem Wechsel aus Videos, Texten und Quiz weckten in mir den Wunsch, tiefer einzusteigen. Das berufsbegleitende Online-Training war für mich der rote Faden zum Erschliessen einer neuen Welt. Ich war gespannt auf das praktische, eigene Analysieren von Datensätzen. Als visuell veranlagter Mensch reizten mich besonders die Möglichkeiten der Datenvisualisierung»

Weiterbildung zum Data Analyst: Was bei der Kursauswahl beachtet werden sollte

Diesen Anregungen folgend suchte sich Ulrich Seidel das nächste Online Training aus. Dieses Mal einen viermonatigen Kurs mit Zertifikat zum Data Analyst. Da ihm der Basiskurs in Aufbau und Herangehensweise gefallen hatte, blieb er beim selben Anbieter. «Gerade dann, wenn man solche umfangreichen Weiterbildungen machen will, sollte man vorher sicherstellen, dass die Kurse zu einem passen: Verfüge ich über Ausdauer, Begeisterung und Computerkenntnisse bis hin zu einem guten Zeitmanagement? Wenn man neben einem laufenden Projekt nur abends Zeit hat für das Training, bedeutet das auch Abstimmung im Familiären», meint Seidel. «Und es wäre schade, wenn einem während der vier Monate die Luft ausgeht, zumal die Preise je nach Kurs und Anbieter zwischen 3000 und 5000 Euro liegen können.» Gute Kursanbieter stellen in einem Vorgespräch sicher, dass die Trainingsteilnehmer auch wirklich belastbar sind bzw. Grundvoraussetzungen mitbringen, die auf eine erfolgreiche Teilnahme schliessen lassen. Sie klopfen die Motivation der Teilnehmer ab, zeigen Erfolgsquoten auf und stellen klar, wie viel Zeit nötig ist, um die Zertifizierungsprüfung zu meistern. Kurse mit ausführlichem Vorgespräch fördern das Gefühl, eine gute Investition zu tätigen. «Bei meinem Kurs hat mir sehr gut gefallen, dass ich jederzeit den Kontakt aufnehmen konnte zu den Mentoren für Verständnisfragen, Organisatorisches und Feedback. Sei es über ein kursinternes Forum mit schnellen Antwortzeiten, per Mail, Telefon oder auch über das Angebot regelmässiger Telefonkonferenzen. Umgekehrt konnten sich auch die Mentoren von meinen Fortschritten ein klares Bild machen.» Genau zu wissen, wo man steht, ist sicherlich sehr wichtig bei einer Online Weiterbildung. Gute Trainings bieten von vornherein eine Übersicht zum Kursaufbau und zum Stand, wie weit man schon gekommen ist. Auf diese Weise erhält der Teilnehmer trotz komplexer Materie gut strukturierte Inhalte und damit den roten Faden auf dem Weg zum Lernerfolg.

Anwendungsorientierte Weiterbildung: Von der Theorie zum Sudoku-Löser

«Wie gesagt, ich bin ein visueller Mensch, und mein Kurs hat mich auf vielfältige Weise angesprochen: Durch anschauliche Begriffserklärungen, unterstützende Grafiken und die Aufgabe, aus einer grossen Datenmenge mit manchmal nur wenigen Programmzeilen aussagefähige Diagramme zu erstellen. Faszinierend, wenn sich aus nicht greifbarem statistischem Zahlenmaterial in Sekundenschnelle ein überraschendes Bild abzeichnet: Etwa der Stadtplan von New York, ausgehend von Fahrdaten eines Taxiunternehmens. Oder wenn man IP-Adressen von Besuchern einer Website auswertet, und es entsteht im Streudiagramm die Kontur einer Weltkarte.» Solche praxisnahen Aufgaben lassen den Funken überspringen. Aus passiv-konsumierenden Kursteilnehmern werden idealerweise selbständig Handelnde, die eigene Anwendungsfälle erforschen wollen. Und der erkennbare Zuwachs an Fähigkeiten erhöht die Motivation, das Gebiet über den Kurs hinaus weiter zu verfolgen. Was für nachhaltiges Lernen wichtig ist, weil man ohne fortwährende Praxis die Dinge auch schnell wieder vergisst. «Mir fiel ein schweres Sudoku-Rätsel ein, das ich vor ein paar Wochen halb gelöst zur Seite gelegt hatte.

Sudoku - manell gescheitert

Wie wäre es, ein Programm zu schreiben, das auf Knopfdruck grosse Mengen wahlweise gültiger oder ungültiger Sudokus generiert? Und mit diesen Daten ein zweites Programm zu trainieren, das Sudokus mittels maschinellem Lernen lösen kann?»

Seidel hatte in der Zwischenzeit schon so viele andere Aufgaben gelöst und Programmierpraxis mit Python erworben, dass er sich ohne Scheu an die Arbeit machte. Sein Plan war, zunächst die manuelle Vorgehensweise zum Lösen des Sudokus im Programm nachzubilden.

Flussdiagramm zur maschinellen Lösung des Sudokus
Flussdiagramm für die Lösung www.seidel.graphics

Nur, dass diese Vorgehensweise bislang gar nicht so klar festgelegt war, sondern bei ihm auf einem hohen Anteil Intuition und Probieren beruhte.

Es zeigte sich, dass die unterschiedlichen Lösungsstrategien sich wechselseitig bedingen. Das Ausfüllen eines Feldes hat Auswirkungen auf entfernte Felder, deren Lösung zu einer Kaskade weiterer Konsequenzen führt.

Erst nach Erstellung eines Flussdiagramms trat der vollständige Lösungsweg mit seinen Schleifen und rekursiven Komponenten zutage.

Sudoku Lösung Data Science - Startmartrix
Startmatrix – erste Schritte www.seidel.graphics
Die maschinell erstellte Lösung des Sudokus
Die Lösung der Aufgabe www.seidel.graphics

«Ich war selbst von der Schönheit dieser verborgenen Strukturen überrascht. Das war für mich ein echter Durchbruch und ein Zeichen meines eigenen Fortschritts. Durch methodisches, analytisches Vorgehen konnte ich den Algorithmus verbessern. Fragestellungen tauchten auf, die zunächst keine Rolle gespielt hatten: Aspekte der Performance, der Modularisierung oder des Log-Levels. Welche Fälle könnten vielleicht eintreten, und sollte man sie vorab berücksichtigen? Welche Vor- und Nachteile bieten unterschiedliche Entwicklungsumgebungen? Beglückend der Moment, in dem das Sudoku nicht einfach nur als Schema von 9x9 Ziffern dargestellt wurde, sondern mit passenden Rahmenlinien in ansprechendem Layout», freut sich Seidel.

Junior Data Scientist mit 20 Jahren Berufserfahrung

Mit diesem Einsatz war es für Seidel nicht schwer, sich als Data Analyst zertifizieren zu lassen und später auch noch das Training zum Data Driven Management zu absolvieren. Inzwischen macht er seinen vierten Kurs zum Data Scientist. Trotz der kleinen und grossen Erfolge, die er in den Kursen und nebenher hatte, bleibt er Realist: «Das Gebiet der Datenanalyse ist riesig. Jedes Datenprojekt hat seine eigenen, neuen Herausforderungen. Zwar kenne ich mich schon lange aus mit Datenbanken und Anwendungsprogrammen, aber mit Abschluss des Trainings bin ich Junior Data Scientist. Als solcher möchte ich natürlich kein Projekt alleine wuppen sondern in einem Team für die Fachabteilung arbeiten, zusammen mit Data Analysts, Data Scientists und Data Engineers.» Ideal wäre ein bunt gemischtes KI-Team, in dem alle voneinander lernen können und wollen. «Vielleicht sind das junge Menschen, die noch nie in Assembler programmieren mussten und für die ein Leben ohne Handy undenkbar ist. Vielleicht sind es auch Senior Hipster, die sich erst mal auf den reifen Junior Data Scientist einlassen müssen», meint er schmunzelnd. Man merkt, dass er seine Lage positiv sieht und im Grunde optimistisch ist. Auf die Frage, ob ihm bewusst ist, dass er in dem Bereich wohl nicht denselben Stundensatz wie bisher verlangen kann, reagiert er aufgeräumt: «Ich bin bereit hier Abstriche zu machen und einen realistischen Stundensatz anzubieten.» Seidel fügt aber hinzu, dass ihm seine reichhaltige Projekterfahrung sehr zu Gute kommt und er daher eine steile Lernkurve annimmt.

Jeden Morgen mit neuen Ideen aufwachen

Ulrich Seidel geht jedenfalls seinen Weg unbeirrt weiter. Bis zum Abschluss des vorerst letzten Trainings hat er nicht nur das Aufsetzen von Projekten mit Data Storytelling gelernt und das Erstellen von Datenanalysen, sondern auch das Trainieren von Algorithmen zum Maschinellen Lernen. Das war alles rückblickend ein langer Weg, und er schreibt es auch ein wenig der Corona Situation und den vermehrten Leerlaufphasen zu, dass er so gut durch die Kurse gekommen ist. «Man sollte sich wirklich klar sein, dass das harte zusätzliche Arbeit ist, und dass man Abstriche in der Freizeit in Kauf nehmen muss», gibt er nochmals zu bedenken. «Bei dem Preis, den man für eine solche Fortbildung zahlt, sollte man sich wirklich sicher sein, dass man es schaffen kann. Die Zertifizierung nicht zu erhalten, wäre einfach zu bitter!» Aber die Ausdauer hat sich in Seidels Fall unfassbar positiv ausgewirkt: «Ich wache jeden Tag mit neuen Ideen auf und freue mich über die vielen Einsatzszenarien. Ich sehe die Verbindung zwischen meiner bisherigen Berufstätigkeit und neuen Anwendungen im Bereich KI und Big Data, die ja auch entwickelt, getestet und dokumentiert werden müssen. Wir können unser Leben auch in Pandemiezeiten aktiv gestalten, das ist einfach gut.»

Ulrich Seidel

Ulrich Seidel ist Diplom-Technomathematiker und zertifizierter Softwaretester. Bisherige Themen waren Logistik, E-Commerce, Low-Code- und Abrechnungssysteme. Als Digital Artist vereint er sein Faible für Musik, Visualisierung und Programmierung. Seine Zertifizierung als Data Analyst bei dem Ausbilder Stackfuel eröffnet ihm neue Einsatzgebiete. Demnächst gehört er zu den wenigen Junior Data Scientists mit über 20 Jahren Berufserfahrung.