Data Engineer und Data Scientist
Aktualisiert am 01.07.2024
Profil
Mitarbeiter eines Dienstleisters
Remote-Arbeit
Verfügbar ab: 15.07.2024
Verfügbar zu: 100%
davon vor Ort: 100%
Skill-Profil eines fest angestellten Mitarbeiters des Dienstleisters

Einsatzorte

Einsatzorte

Essen (+75km) Ibbenbüren (+75km) Cochem (+75km) Bonn (+75km) Soest (+50km)
möglich

Projekte

Projekte

1 Monat
2024-06 - heute

Entwicklung, BI-Beratung, Köln

Entwickler Kotlin Spring Boot WebFlux ...
Entwickler
  • Entwicklung eines Zeiterfassungstools
  • Backend-Entwicklung mittels SpringBoot und WebFlux
  • Implementierung neuer Funktionaltäten 
Kotlin Spring Boot WebFlux Reactive Streams
Kotlin Spring Boot WebFlux Reactive Streams
2 Monate
2024-05 - 2024-06

Workshop, Lebensmittelqualität, Bonn

Data Engineer Kafka Debezium Docker ...
Data Engineer
  • Analyse einer bestehenden Infrastruktur zur Datenreplizierung mittels Kafka/Debezium
  • Konzeption einer Zielinfrastruktur zur Stabilisierung der Datenreplikation
  • Technische Beratung 
Kafka Debezium Docker PostgreSQL
Kafka Debezium Docker PostgreSQL
2 Jahre 3 Monate
2022-01 - 2024-03

Data Engineer, Finance, Frankfurt

Data Engineer und Tech Lead Python Pandas Numpy ...
Data Engineer und Tech Lead
  • Implementierung und Migration einer Plattform zur Verarbeitung und Transformation statistischer Zeitreihendaten (SDMX) mit Python
  • ? Arbeit in einem agilen Team (Scrum)
  • ? Sicherstellung von Codequalität und Testabdeckung (UnitTesting, Mocking)
  • ? Technische Beratung und Unterstützung der Anwender 
Python Pandas Numpy Pytest Pydantic GitLab CI/CD Jupyter Atlassian JIRA
Python Pandas Numpy Pytest Pydantic GitLab CI/CD Jupyter Atlassian JIRA
1 Jahr 1 Monat
2020-09 - 2021-09

Data Scientist, Energienetze,

Data Scientist Python
Data Scientist
  •  Analyse von georeferenzierten, sozioökonomischen und Energienetzdaten mit Python/GeoPandas/Pandas 
  • Simulationen zur zukünftigen Entwicklung im Wärmesektor (Heizungstechnologien, Energieträger, Energiebedarf) 
  • Planungsunterstützung in Bezug auf Elektromobilität 
  • Visualisierung und Erstellung interaktiver Karten mit Python/Folium/Leaflet 
  • Automatisierte Erstellung von Reports
Jupyter AWS/CodeCommit Pandas GeoPandas Folium/Leaflet H3 geovoronoi OSMnx
Python
Bergheim
8 Monate
2020-01 - 2020-08

Data Scientist

Python-Entwickler und Data Scientist R
Python-Entwickler und Data Scientist
  • Verarbeitung und Transformation von Geodaten mit Python/GeoPandas
  • Geocoding, Spatial Joins
  • Durchführung größerer Berechnungen in der AWS-Cloud
  • Weiterentwicklung einer R-Shiny-Anwendung
  • Initialanalysen mit Power BI
Python Pandas GeoPandas Shiny Power BI
R
Köln
1 Jahr 6 Monate
2018-07 - 2019-12

Apache Kafka Entwicklung

Berater und Entwickler Scrum
Berater und Entwickler
  • Mitarbeit in Kafka DevOps-Team
  • Entwicklung einer Web-basierten Self-Service-Plattform zum Management von Kafka Topics und ACLs
    • Backend-Entwicklung der REST-APIs
    • Continuous Integration
  • Beratung und Schulung von Entwicklerteams
    • Use Cases zur Nutzung von Kafka
    • Implementierung, Konfiguration
  • Weiterentwicklung der Kafka-Plattform
    • Zentralisiertes Logging mittels Filebeat, Metricbeat, ELK
    • Entwicklung von Ansible Playbooks für Deployments
Apache Kafka Kafka Streams Java Spring Boot Git Jenkins Linux Ansible Python
Scrum
Amsterdam
7 Monate
2017-12 - 2018-06

Apache Kafka Entwicklung

Berater und Entwickler
Berater und Entwickler
  • Mitarbeit in internationalem Kafka DevOps Team
  • Softwareentwicklung im Kafka-Umfeld
  • REST API zum Topic- und ACL-Management
  • Customized Principal Builder für SSL-Authentifizierung
  • AVRO-Serialisierung
  • Deployment und Management von Kafka-Clustern per Ansible
  • Entwicklung von Ansible Playbooks
Apache Hadoop Hortonworks Administration Linux Hive Pig Kafka Splunk Storm Ansible AVRO
Nürnberg
5 Monate
2017-07 - 2017-11

Big Data & BI Beratung

Big Data Engineer und Data Scientist
Big Data Engineer und Data Scientist
  •  Aufbau eines Hadoop-Clusters 
  • Datenaufbereitung und -analyse mit Apache Hive, Pig und Spark (PySpark) 
  • Streaming und Verarbeitung von Real-Time Daten mittels Apache NiFi, Kafka und Storm
  • Feature Engineering 
  • Modellentwicklung 
  • Clustering 
  • Automatisierte AWS/EC2-Einrichtung und Ausführung von Programmen, Skript gesteuert
Hadoop (Hortonworks) Linux Hive Pig Kafka Spark (PySpark) Storm SQL AWS
Köln
4 Monate
2017-07 - 2017-10

Big Data

Big Data Engineer Python
Big Data Engineer
  • Aufbau eines Hadoop-Clusters
  • Datenaufbereitung und -analyse mit Apache Hive, Pig und Spark (PySpark)
  • Streaming und Verarbeitung von Real-Time Daten mittels
    Apache NiFi, Kafka und Storm
  • Feature Engineering
  • Modellentwicklung
  • Clusterin
  • Automatisierte AWS/EC2-Einrichtung und Ausführung von Programmen, Skript gesteuert
Apache Hadoop Hortonworks Administration Linux Hive Pig Kafka Splunk Storm Spark PySpark AWS
Python
IT-Beratung
Köln
1 Jahr 7 Monate
2016-01 - 2017-07

Applying Community Drift to Time-Aware Recommender Systems

Masterarbeit Recommender Systems Greedy Filtering
Masterarbeit
  • Modellentwicklung

  - Prognose von Bewertungen
    (Matrix Factorization und Item Neighborhood Modelle)

  - Konstruktion von User- und Item-Graphen
    (K-Nearest-Neighbors, verschiedene Ähnlichkeitsmetriken)

  - User und Item Clustering
    (Community Detection Algorithmen DMID und Walktrap)

  - Maschinelles Lernen der Modellparameter
    (Stochastic Gradient Descent)

  • Implementierung als Algorithmen in Java
  • Evaluierung auf einem Compute Cluster der RWTH Aachen
  • Implementierung eines Recommender Systems mit RESTful API
  • Veröffentlichung der Ergebnisse im Rahmen der RecSys
    Konferenz 2017 (Workshop on Temporal Reasoning in
      Recommender Systems)
Java Eclipse Jersey JUnit Swagger Git Ivy Ant MySQL Java Native Access
Recommender Systems Greedy Filtering
RWTH Aachen
Aachen
8 Jahre 6 Monate
2004-09 - 2013-02

Betreuung Netzwerke

Entwickler Netzwerkadministration Cisco Wireless
Entwickler

Wireless LAN

  • Architektur / Design
  • Implementierung und Betrieb der Infrastruktur
  • Zusammenarbeit mit dem Produktmanagement
  • Mitarbeit im globalen Fokus-Team Wireless LAN
  • Administration Linux-basierter Management-Systeme
    z.B. Cisco Wireless Control System

 

Routing und Switching

  • Planung und Implementierung von Netzwerklösungen
  • Betrieb und Troubleshooting der Infrastruktur
  • Rufbereitschaften

 

Projekte

  • Konzernweite, globale Standardisierung des Wireless LAN

     (Client-Zugriff, Infrastruktur, Hardware, Konfigurationen)

  • Konzeption und Implementierung von WLAN-Lösungen für
    Gastzugänge, IP-Telefonie, Produktionsumgebungen
  • Migration der Netzwerk-Infrastruktur bei
    Unternehmensfusionen und -abspaltungen
  • Evaluierung und Konzeption des Einsatzes von Industrial
    Ethernet Technologien zum Monitoring von Pipelines
Cisco
Netzwerkadministration Cisco Wireless
Chemie/Pharma
Leverkusen

Position

Position

Martin Barth ist Berater für Big Data und Data Science. Im Rahmen seiner bisherigen Projekte sammelte er insbesondere Erfahrung mit Apache Kafka, Geo- und

sozioökonomischen Daten im Banken- und Energiesektor.

Er verfügt über Zertifizierungen als ?Hortonworks Certified Associate? und als ?HDP Certified Spark Developer?.

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

Administration Linux
Ambari
Ansible
Ant
Apache Hadoop
Apache Kafka
AVRO
AWS
Azure
Cisco
Cisco Wireless
Eclipse
Folium
Folium/Leaflet
Git
Hive
Hortonworks
Hortonworks Certified Associate
Ivy
Java Native Access
Jenkins
Jersey
JUnit
Jupyter
Kafka
Kafka Streams
Netzwerkadministration
Pig
Power BI
Scikit-Learn
Scrum
Shell-Scripting
Shiny
Spark
HDP Certified Spark Developer
Splunk Storm
Spring Boot
Swagger
Tableau

Betriebssysteme

Linux

Programmiersprachen

GeoPandas
Java
Leaflet
Pandas
PySpark
R

Datenbanken

MySQL

Berechnung / Simulation / Versuch / Validierung

Greedy Filtering
Python
Recommender Systems

Einsatzorte

Einsatzorte

Essen (+75km) Ibbenbüren (+75km) Cochem (+75km) Bonn (+75km) Soest (+50km)
möglich

Projekte

Projekte

1 Monat
2024-06 - heute

Entwicklung, BI-Beratung, Köln

Entwickler Kotlin Spring Boot WebFlux ...
Entwickler
  • Entwicklung eines Zeiterfassungstools
  • Backend-Entwicklung mittels SpringBoot und WebFlux
  • Implementierung neuer Funktionaltäten 
Kotlin Spring Boot WebFlux Reactive Streams
Kotlin Spring Boot WebFlux Reactive Streams
2 Monate
2024-05 - 2024-06

Workshop, Lebensmittelqualität, Bonn

Data Engineer Kafka Debezium Docker ...
Data Engineer
  • Analyse einer bestehenden Infrastruktur zur Datenreplizierung mittels Kafka/Debezium
  • Konzeption einer Zielinfrastruktur zur Stabilisierung der Datenreplikation
  • Technische Beratung 
Kafka Debezium Docker PostgreSQL
Kafka Debezium Docker PostgreSQL
2 Jahre 3 Monate
2022-01 - 2024-03

Data Engineer, Finance, Frankfurt

Data Engineer und Tech Lead Python Pandas Numpy ...
Data Engineer und Tech Lead
  • Implementierung und Migration einer Plattform zur Verarbeitung und Transformation statistischer Zeitreihendaten (SDMX) mit Python
  • ? Arbeit in einem agilen Team (Scrum)
  • ? Sicherstellung von Codequalität und Testabdeckung (UnitTesting, Mocking)
  • ? Technische Beratung und Unterstützung der Anwender 
Python Pandas Numpy Pytest Pydantic GitLab CI/CD Jupyter Atlassian JIRA
Python Pandas Numpy Pytest Pydantic GitLab CI/CD Jupyter Atlassian JIRA
1 Jahr 1 Monat
2020-09 - 2021-09

Data Scientist, Energienetze,

Data Scientist Python
Data Scientist
  •  Analyse von georeferenzierten, sozioökonomischen und Energienetzdaten mit Python/GeoPandas/Pandas 
  • Simulationen zur zukünftigen Entwicklung im Wärmesektor (Heizungstechnologien, Energieträger, Energiebedarf) 
  • Planungsunterstützung in Bezug auf Elektromobilität 
  • Visualisierung und Erstellung interaktiver Karten mit Python/Folium/Leaflet 
  • Automatisierte Erstellung von Reports
Jupyter AWS/CodeCommit Pandas GeoPandas Folium/Leaflet H3 geovoronoi OSMnx
Python
Bergheim
8 Monate
2020-01 - 2020-08

Data Scientist

Python-Entwickler und Data Scientist R
Python-Entwickler und Data Scientist
  • Verarbeitung und Transformation von Geodaten mit Python/GeoPandas
  • Geocoding, Spatial Joins
  • Durchführung größerer Berechnungen in der AWS-Cloud
  • Weiterentwicklung einer R-Shiny-Anwendung
  • Initialanalysen mit Power BI
Python Pandas GeoPandas Shiny Power BI
R
Köln
1 Jahr 6 Monate
2018-07 - 2019-12

Apache Kafka Entwicklung

Berater und Entwickler Scrum
Berater und Entwickler
  • Mitarbeit in Kafka DevOps-Team
  • Entwicklung einer Web-basierten Self-Service-Plattform zum Management von Kafka Topics und ACLs
    • Backend-Entwicklung der REST-APIs
    • Continuous Integration
  • Beratung und Schulung von Entwicklerteams
    • Use Cases zur Nutzung von Kafka
    • Implementierung, Konfiguration
  • Weiterentwicklung der Kafka-Plattform
    • Zentralisiertes Logging mittels Filebeat, Metricbeat, ELK
    • Entwicklung von Ansible Playbooks für Deployments
Apache Kafka Kafka Streams Java Spring Boot Git Jenkins Linux Ansible Python
Scrum
Amsterdam
7 Monate
2017-12 - 2018-06

Apache Kafka Entwicklung

Berater und Entwickler
Berater und Entwickler
  • Mitarbeit in internationalem Kafka DevOps Team
  • Softwareentwicklung im Kafka-Umfeld
  • REST API zum Topic- und ACL-Management
  • Customized Principal Builder für SSL-Authentifizierung
  • AVRO-Serialisierung
  • Deployment und Management von Kafka-Clustern per Ansible
  • Entwicklung von Ansible Playbooks
Apache Hadoop Hortonworks Administration Linux Hive Pig Kafka Splunk Storm Ansible AVRO
Nürnberg
5 Monate
2017-07 - 2017-11

Big Data & BI Beratung

Big Data Engineer und Data Scientist
Big Data Engineer und Data Scientist
  •  Aufbau eines Hadoop-Clusters 
  • Datenaufbereitung und -analyse mit Apache Hive, Pig und Spark (PySpark) 
  • Streaming und Verarbeitung von Real-Time Daten mittels Apache NiFi, Kafka und Storm
  • Feature Engineering 
  • Modellentwicklung 
  • Clustering 
  • Automatisierte AWS/EC2-Einrichtung und Ausführung von Programmen, Skript gesteuert
Hadoop (Hortonworks) Linux Hive Pig Kafka Spark (PySpark) Storm SQL AWS
Köln
4 Monate
2017-07 - 2017-10

Big Data

Big Data Engineer Python
Big Data Engineer
  • Aufbau eines Hadoop-Clusters
  • Datenaufbereitung und -analyse mit Apache Hive, Pig und Spark (PySpark)
  • Streaming und Verarbeitung von Real-Time Daten mittels
    Apache NiFi, Kafka und Storm
  • Feature Engineering
  • Modellentwicklung
  • Clusterin
  • Automatisierte AWS/EC2-Einrichtung und Ausführung von Programmen, Skript gesteuert
Apache Hadoop Hortonworks Administration Linux Hive Pig Kafka Splunk Storm Spark PySpark AWS
Python
IT-Beratung
Köln
1 Jahr 7 Monate
2016-01 - 2017-07

Applying Community Drift to Time-Aware Recommender Systems

Masterarbeit Recommender Systems Greedy Filtering
Masterarbeit
  • Modellentwicklung

  - Prognose von Bewertungen
    (Matrix Factorization und Item Neighborhood Modelle)

  - Konstruktion von User- und Item-Graphen
    (K-Nearest-Neighbors, verschiedene Ähnlichkeitsmetriken)

  - User und Item Clustering
    (Community Detection Algorithmen DMID und Walktrap)

  - Maschinelles Lernen der Modellparameter
    (Stochastic Gradient Descent)

  • Implementierung als Algorithmen in Java
  • Evaluierung auf einem Compute Cluster der RWTH Aachen
  • Implementierung eines Recommender Systems mit RESTful API
  • Veröffentlichung der Ergebnisse im Rahmen der RecSys
    Konferenz 2017 (Workshop on Temporal Reasoning in
      Recommender Systems)
Java Eclipse Jersey JUnit Swagger Git Ivy Ant MySQL Java Native Access
Recommender Systems Greedy Filtering
RWTH Aachen
Aachen
8 Jahre 6 Monate
2004-09 - 2013-02

Betreuung Netzwerke

Entwickler Netzwerkadministration Cisco Wireless
Entwickler

Wireless LAN

  • Architektur / Design
  • Implementierung und Betrieb der Infrastruktur
  • Zusammenarbeit mit dem Produktmanagement
  • Mitarbeit im globalen Fokus-Team Wireless LAN
  • Administration Linux-basierter Management-Systeme
    z.B. Cisco Wireless Control System

 

Routing und Switching

  • Planung und Implementierung von Netzwerklösungen
  • Betrieb und Troubleshooting der Infrastruktur
  • Rufbereitschaften

 

Projekte

  • Konzernweite, globale Standardisierung des Wireless LAN

     (Client-Zugriff, Infrastruktur, Hardware, Konfigurationen)

  • Konzeption und Implementierung von WLAN-Lösungen für
    Gastzugänge, IP-Telefonie, Produktionsumgebungen
  • Migration der Netzwerk-Infrastruktur bei
    Unternehmensfusionen und -abspaltungen
  • Evaluierung und Konzeption des Einsatzes von Industrial
    Ethernet Technologien zum Monitoring von Pipelines
Cisco
Netzwerkadministration Cisco Wireless
Chemie/Pharma
Leverkusen

Position

Position

Martin Barth ist Berater für Big Data und Data Science. Im Rahmen seiner bisherigen Projekte sammelte er insbesondere Erfahrung mit Apache Kafka, Geo- und

sozioökonomischen Daten im Banken- und Energiesektor.

Er verfügt über Zertifizierungen als ?Hortonworks Certified Associate? und als ?HDP Certified Spark Developer?.

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

Administration Linux
Ambari
Ansible
Ant
Apache Hadoop
Apache Kafka
AVRO
AWS
Azure
Cisco
Cisco Wireless
Eclipse
Folium
Folium/Leaflet
Git
Hive
Hortonworks
Hortonworks Certified Associate
Ivy
Java Native Access
Jenkins
Jersey
JUnit
Jupyter
Kafka
Kafka Streams
Netzwerkadministration
Pig
Power BI
Scikit-Learn
Scrum
Shell-Scripting
Shiny
Spark
HDP Certified Spark Developer
Splunk Storm
Spring Boot
Swagger
Tableau

Betriebssysteme

Linux

Programmiersprachen

GeoPandas
Java
Leaflet
Pandas
PySpark
R

Datenbanken

MySQL

Berechnung / Simulation / Versuch / Validierung

Greedy Filtering
Python
Recommender Systems

Vertrauen Sie auf Randstad

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.