Freelancer: Data Scientist | Machine Learning Engineer | Python | AI | NLP | Mehrwert durch Daten erzeugen

Freiberufler / Selbstst�ndiger

Remote-Arbeit

Verf�gbar ab: 01.04.2024

Verf�gbar zu: 100%

davon vor Ort: 50%

Top-Skills

Python

SQL

Machine Learning

Deep Learning

NLP

LLM

Computer Vision

PyTorch

TensorFlow

Apache Spark

Databricks

Pandas

MLOps

Kubernetes

Docker

CI/CD

Git

Mlflow

Java

Beratung

Scrum

AWS s3

Apache Airflow

Sprachen

Deutsch

Englisch

Einsatzorte

L�nder

Deutschland

Remote-Arbeit

m�glich

Projekte

1 Jahr 10 Monate

2022-09 - heute

Clustering von mehrdimensionalen Daten

Data Scientist

Rolle

Data Scientist

Projektinhalte

Clustering von mehrdimensionalen Daten durch Ausnutzung von effizienter LLM Datenrepr�sentation - Verbesserung von existierenden Clustering L�sungen um 50%
Entwicklung von verteilten, end-to-end Machine Learning Pipelines in PySpark, zur Anomalieerkennung und Datensatzverkn�pfung - Erm�glichen von manueller Uberpr�fung von Anomalien durch Fachabteilungen.
Skalierung und Logging der Hyperparametersuche von ML Pipelines mit PySpark und MLFlow - Beschleunigung der bisherigen Suche um 500%.
Deployment, Skalierung und �berwachung von KI-Anwendungen auf einem Kubernetes Cluster.�
Beratung externer Kunden zu modernen KI-Architekturen und -Tools.

Kunde

SVA System Vertrieb Alexander GmbH

Einsatzort

K�ln, Deutschland

2 Monate

2024-03 - 2024-04

Fine tuning von LLMs f�r NLP Use Cases in Deutscher Sprache

Data Scientist Python LLM GenAI

Rolle

Data Scientist

Projektinhalte

Fine-tuning von foundational LLMs (Llama, Mistral) mit dem Ziel der Generierung von Textzusammenfassungen in deutscher Sprache
Umsetzung mittels Parameter Efficient Fine Tuning (PEFT) und Low Rank Adaption (LoRA) mit Huggingface
Optimierung des Trainingsprozesses auf Nvidia A100 GPUs
Effizientes und kosteng�nstiges Deployment der L�sung auf Nvidia A30 GPUs - Bereitstellung des Modells via FastAPI

Produkte

Llama-7b Mistral-7b PEFT Lora Huggingface RAG FastAPI Transformer

Kenntnisse

Python LLM GenAI

3 Monate

2024-01 - 2024-03

Migration von KI-Anwendungen vom Hadoop Stack in einen Kubernetes Data Lake

Machine Learning Engineer Python Kubernetes Docker

Rolle

Machine Learning Engineer

Projektinhalte

Migrieren von KI-Anwendungen von einem Hadoop Data Lake zu einem modernen Kubernetes Data Lake

Deployment, Skalierung und �berwachung von KI-Anwendungen im Kubernetes Cluster
Nutzung, Konfiguration und Optimierung von Apache Spark auf Kubernetes
Einf�hrung von modernen GitOps Praktiken f�r CI/CD im Migrationsprozess

Produkte

PySpark Hadoop Kubernetes Docker Stackable Data Lake S3 Hashicorp Vault Apache Airflow

Kenntnisse

Python Kubernetes Docker

Einsatzort

K�ln

7 Monate

2023-07 - 2024-01

Skalierung und Deployment von KI-Anwendungen mit PySpark

Machine Learning Engineer Python PySpark MLOps

Rolle

Machine Learning Engineer

Projektinhalte

Deployment von entwickelten PySpark Pipelines im Spark Cluster
Skalierung und Logging der Hyperparametersuche von ML-Pipelines mit PySpark und MLFlow - Beschleunigung der bisherigen Suche um 500%.
Performance- und Ressourcen Optimierung von verschiedenen Machine Learning Apps durch anpassen von Spark Konfigurationen und Datenpartitionierung
Einbindung von Monitoring Tools (mlflow) zur kontinuierlichen Modell�berwachung (MLOps)

Produkte

mlflow

Kenntnisse

Python PySpark MLOps

6 Monate

2023-02 - 2023-07

Enwicklung von KI-Anwendungen in PySpark

Data Scientist Python Machine Learning Clustering

Rolle

Data Scientist

Projektinhalte

Clustering von mehrdimensionalen Daten durch Ausnutzung von effizienter LLM Datenrepr�sentation - Verbesserung von existierenden Clustering L�sungen um 50%

Entwicklung von verteilten, end-to-end Machine Learning Pipelines in PySpark, zur Anomalieerkennung und Datensatzverkn�pfung - Erm�glichen von manueller �berpr�fung von Anomalien durch Fachabteilungen.

Verwendung von Approximate Nearest Neighbor Algorithmen (ANN) zur effizienten Indizierung von Daten

Produkte

PySpark Hadoop Data Lake

Kenntnisse

Python Machine Learning Clustering

9 Monate

2021-01 - 2021-09

Datenanalyse

Data Analyst Python R SQL

Rolle

Data Analyst

Projektinhalte

Entwickeln von baumbasierten Klassifizierungsmodellen zur Erkennung von Anomalien in Ladestationen f�r Elektrofahrzeuge, wodurch datengesteuerte Validierungsregeln eingef�hrt wurden.
Implementieren mehrerer web-scraper, wodurch mehr als 100k neue Ladestationen zur Datenbank hinzuf�gt wurden.

Produkte

sklearn postman MS SQL Server

Kenntnisse

Python R SQL

Einsatzort

Utrecht, Niederlande

Aus- und Weiterbildung

2 Jahre 7 Monate

2020-02 - 2022-08

Master of Science: Artificial Intelligence

Master of Science, GPA: 8.22/10.0, cum laude, Utrecht University

Abschluss

Master of Science, GPA: 8.22/10.0, cum laude

Institution, Ort

Utrecht University

Schwerpunkt

Deep Learning, NLP, Reinforcement Learning, Causal Inference, Bayesian Statistics
Thesis: auf Anfrage

3 Jahre 1 Monat

2016-10 - 2019-10

Bachelor of Science: Psychologie in IT

Bachelor of Science, GPA: 1.8/4.0, Technische Universit�t Darmstadt

Abschluss

Bachelor of Science, GPA: 1.8/4.0

Institution, Ort

Technische Universit�t Darmstadt

Schwerpunkt

Statistik, Machine Learning, Software Engineering
Thesis: Solving Bongard Problems Using Artificial Neural Networks

Position

Data Scientist
AI Engineer
Machine Learning Engineer

Kompetenzen

Top-Skills

Python SQL Machine Learning Deep Learning NLP LLM Computer Vision PyTorch TensorFlow Apache Spark Databricks Pandas MLOps Kubernetes Docker CI/CD Git Mlflow Java Beratung Scrum AWS s3 Apache Airflow

Schwerpunkte

NLP

Deep Learning

Kubernetes

Produkte / Standards / Erfahrungen / Methoden

Agile Softwareentwicklung

Scrum

Technische Skills

Machine Learning, Deep Learning, Clustering, Time Series Forecasting, GenAI, LLM,�Computer Vision, PyTorch, PySpark, SparkML, Databricks, scikit-learn, XGBoost,�Pandas, MLOps, Mlflow, Airflow, K8s, Docker, Ray, Statistics, A/B Testing,�Bayesian Statistics, Causal Inference, Visualization, CI/CD, Git

Soft Skills

Beratung, Kommunikation, Pr�asentation vor Stakeholdern, SCRUM

Programmiersprachen

Python

SQL

Java

C++

Einsatzorte

L�nder

Deutschland

Remote-Arbeit

m�glich

Projekte

1 Jahr 10 Monate

2022-09 - heute

Clustering von mehrdimensionalen Daten

Data Scientist

Rolle

Data Scientist

Projektinhalte

Clustering von mehrdimensionalen Daten durch Ausnutzung von effizienter LLM Datenrepr�sentation - Verbesserung von existierenden Clustering L�sungen um 50%
Entwicklung von verteilten, end-to-end Machine Learning Pipelines in PySpark, zur Anomalieerkennung und Datensatzverkn�pfung - Erm�glichen von manueller Uberpr�fung von Anomalien durch Fachabteilungen.
Skalierung und Logging der Hyperparametersuche von ML Pipelines mit PySpark und MLFlow - Beschleunigung der bisherigen Suche um 500%.
Deployment, Skalierung und �berwachung von KI-Anwendungen auf einem Kubernetes Cluster.�
Beratung externer Kunden zu modernen KI-Architekturen und -Tools.

Kunde

SVA System Vertrieb Alexander GmbH

Einsatzort

K�ln, Deutschland

2 Monate

2024-03 - 2024-04

Fine tuning von LLMs f�r NLP Use Cases in Deutscher Sprache

Data Scientist Python LLM GenAI

Rolle

Data Scientist

Projektinhalte

Fine-tuning von foundational LLMs (Llama, Mistral) mit dem Ziel der Generierung von Textzusammenfassungen in deutscher Sprache
Umsetzung mittels Parameter Efficient Fine Tuning (PEFT) und Low Rank Adaption (LoRA) mit Huggingface
Optimierung des Trainingsprozesses auf Nvidia A100 GPUs
Effizientes und kosteng�nstiges Deployment der L�sung auf Nvidia A30 GPUs - Bereitstellung des Modells via FastAPI

Produkte

Llama-7b Mistral-7b PEFT Lora Huggingface RAG FastAPI Transformer

Kenntnisse

Python LLM GenAI

3 Monate

2024-01 - 2024-03

Migration von KI-Anwendungen vom Hadoop Stack in einen Kubernetes Data Lake

Machine Learning Engineer Python Kubernetes Docker

Rolle

Machine Learning Engineer

Projektinhalte

Migrieren von KI-Anwendungen von einem Hadoop Data Lake zu einem modernen Kubernetes Data Lake

Deployment, Skalierung und �berwachung von KI-Anwendungen im Kubernetes Cluster
Nutzung, Konfiguration und Optimierung von Apache Spark auf Kubernetes
Einf�hrung von modernen GitOps Praktiken f�r CI/CD im Migrationsprozess

Produkte

PySpark Hadoop Kubernetes Docker Stackable Data Lake S3 Hashicorp Vault Apache Airflow

Kenntnisse

Python Kubernetes Docker

Einsatzort

K�ln

7 Monate

2023-07 - 2024-01

Skalierung und Deployment von KI-Anwendungen mit PySpark

Machine Learning Engineer Python PySpark MLOps

Rolle

Machine Learning Engineer

Projektinhalte

Deployment von entwickelten PySpark Pipelines im Spark Cluster
Skalierung und Logging der Hyperparametersuche von ML-Pipelines mit PySpark und MLFlow - Beschleunigung der bisherigen Suche um 500%.
Performance- und Ressourcen Optimierung von verschiedenen Machine Learning Apps durch anpassen von Spark Konfigurationen und Datenpartitionierung
Einbindung von Monitoring Tools (mlflow) zur kontinuierlichen Modell�berwachung (MLOps)

Produkte

mlflow

Kenntnisse

Python PySpark MLOps

6 Monate

2023-02 - 2023-07

Enwicklung von KI-Anwendungen in PySpark

Data Scientist Python Machine Learning Clustering

Rolle

Data Scientist

Projektinhalte

Clustering von mehrdimensionalen Daten durch Ausnutzung von effizienter LLM Datenrepr�sentation - Verbesserung von existierenden Clustering L�sungen um 50%

Entwicklung von verteilten, end-to-end Machine Learning Pipelines in PySpark, zur Anomalieerkennung und Datensatzverkn�pfung - Erm�glichen von manueller �berpr�fung von Anomalien durch Fachabteilungen.

Verwendung von Approximate Nearest Neighbor Algorithmen (ANN) zur effizienten Indizierung von Daten

Produkte

PySpark Hadoop Data Lake

Kenntnisse

Python Machine Learning Clustering

9 Monate

2021-01 - 2021-09

Datenanalyse

Data Analyst Python R SQL

Rolle

Data Analyst

Projektinhalte

Entwickeln von baumbasierten Klassifizierungsmodellen zur Erkennung von Anomalien in Ladestationen f�r Elektrofahrzeuge, wodurch datengesteuerte Validierungsregeln eingef�hrt wurden.
Implementieren mehrerer web-scraper, wodurch mehr als 100k neue Ladestationen zur Datenbank hinzuf�gt wurden.

Produkte

sklearn postman MS SQL Server

Kenntnisse

Python R SQL

Einsatzort

Utrecht, Niederlande

Aus- und Weiterbildung

2 Jahre 7 Monate

2020-02 - 2022-08

Master of Science: Artificial Intelligence

Master of Science, GPA: 8.22/10.0, cum laude, Utrecht University

Abschluss

Master of Science, GPA: 8.22/10.0, cum laude

Institution, Ort

Utrecht University

Schwerpunkt

Deep Learning, NLP, Reinforcement Learning, Causal Inference, Bayesian Statistics
Thesis: auf Anfrage

3 Jahre 1 Monat

2016-10 - 2019-10

Bachelor of Science: Psychologie in IT

Bachelor of Science, GPA: 1.8/4.0, Technische Universit�t Darmstadt

Abschluss

Bachelor of Science, GPA: 1.8/4.0

Institution, Ort

Technische Universit�t Darmstadt

Schwerpunkt

Statistik, Machine Learning, Software Engineering
Thesis: Solving Bongard Problems Using Artificial Neural Networks

Position

Data Scientist
AI Engineer
Machine Learning Engineer

Kompetenzen

Top-Skills

Python SQL Machine Learning Deep Learning NLP LLM Computer Vision PyTorch TensorFlow Apache Spark Databricks Pandas MLOps Kubernetes Docker CI/CD Git Mlflow Java Beratung Scrum AWS s3 Apache Airflow

Schwerpunkte

NLP

Deep Learning

Kubernetes

Produkte / Standards / Erfahrungen / Methoden

Agile Softwareentwicklung

Scrum

Technische Skills

Soft Skills

Beratung, Kommunikation, Pr�asentation vor Stakeholdern, SCRUM

Programmiersprachen

Python

SQL

Java

C++

Vertrauen Sie auf Randstad

Im Bereich Freelancing

Im Bereich Arbeitnehmer�berlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Name E-Mail-Adresse Ihre Frage

Telefonnummer Unternehmen

Ich habe die Datenschutzbestimmungen gelesen und bin damit einverstanden.

Einsatzorte

Projekte

Aus- und Weiterbildung

Position

Kompetenzen

Top-Skills

Schwerpunkte

Produkte / Standards / Erfahrungen / Methoden

Programmiersprachen

Einsatzorte

Projekte

Aus- und Weiterbildung

Position

Kompetenzen

Top-Skills

Schwerpunkte

Produkte / Standards / Erfahrungen / Methoden

Programmiersprachen

Vertrauen Sie auf Randstad

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.