Spezialist für Machine Learning und Computer Vision. Full-Stack Entwicklung mit Python und AWS.
Aktualisiert am 10.06.2024
Profil
Freiberufler / Selbstständiger
Remote-Arbeit
Verfügbar ab: 03.06.2024
Verfügbar zu: 100%
davon vor Ort: 20%
Machine Learning
Computer Vision
Large Language Models
Python
AWS
Google Cloud
OCR
OpenAI
Algorithmenentwicklung
TensorFlow
PyTorch
Webentwicklung
Fullstack
Deutsch
Muttersprache
Englisch
verhandlungssicher

Einsatzorte

Einsatzorte

Hamburg (+50km) Berlin (+50km) Braunschweig (+50km) Hannover (+50km)
möglich

Projekte

Projekte

2 Monate
2024-04 - 2024-05

Automatische Verarbeitung von medizinischen/therapeutischen Datenblättern

Full-Stack-Entwickler OCR Handschriftenerkennung Künstliche Intelligenz ...
Full-Stack-Entwickler

Ich habe für ein Therapie-Institut den Prozess zur Erstellung von wöchentlichen Therapie-Reports aus handschriftlich beschriebenen Datenblättern digitalisiert und automatisiert. Das Ergebnis ist eine Web-App für die Therapeuten. 

Durch die Software wird eine Zeitersparnis von 1h pro Woche und Patient erreicht.

  • Erstellung einer Web-App für Erfassung der wöchentlichen Datenblätter (als Foto oder PDF) und zum Download der wöchentlichen Reports (als Excel-Datei)
  • Verbesserung der OCR-Ergebnisse durch Pre-Processing der Bilddaten
  • Verbesserung der Handschrift-OCR durch Fine-Tuning eines GPT-3.5-Turbo-Modells zur Erkennung und Korrektur von OCR-Fehlern
  • Automatische Verarbeitung aller Datenblätter zur Erstellung eines wöchentlichen Reports als Excel-Datei 


Videos (YouTube):

  • Web-App: https://youtu.be/PZ0ynKCjZRg
  • Post-Processing: https://youtu.be/RvGY9R_evtI

AWS Amazon Textract GPT-3.5 Bootstrap Heroku
OCR Handschriftenerkennung Künstliche Intelligenz Deep Learning Fine-Tuning Python Webentwicklung
Institut für Autismustherapie
(Remote)
2 Monate
2024-02 - 2024-03

Implementierung von RAG (Retrieval Augmented Generation) für ein DMS

Full-Stack-Entwickler Python OCR Vektordatenbanken ...
Full-Stack-Entwickler

Ich habe RAG (Retrieval Augmented Generation) für PaperSpace.ai implementiert, um innerhalb eines DMS beliebige Fragen zu einer Sammlung von Dokumenten beantworten zu können. Diese Technologie ermöglicht ein präzises und effiziente Informationsretrieval.

Durch dieses Feature können Nutzer schnell und zuverlässig relevante Informationen aus ihren Dokumenten extrahieren.

  • Implementierung von OCR zur Erkennung und Extraktion von Text aus Dokumenten
  • Auswahl relevanter Dokumente basierend auf den OCR-Ergebnissen
  • Berechnung der Antworten mittels eines LLMs
  • Markierung relevanter Textstellen zur visuellen Erklärung für den Benutzer


Video:

  • https://youtu.be/yvUjxE851ps

PaperSpace.ai Heroku AWS Qdrant GPT-3.5 Bootstrap
Python OCR Vektordatenbanken Vektor-Embeddings Webentwicklung
PaperSpace GmbH
München
5 Monate
2023-06 - 2023-10

Entwicklung einer Dokumenten-Scan-Technologie

Full-Stack-Entwickler Python C++ Bildverarbeitung ...
Full-Stack-Entwickler

Ich habe für PaperSpace.ai eine fortschrittliche Scan-Technologie entwickelt, die den Prozess der Digitalisierung und Verarbeitung von Dokumenten effizienter gestaltet. Die Lösung sollte mit besonders schwierigen Dokumenten wie gefalteten oder gebogenen Dokumenten aus einem Umschlag gut funktionieren und außerdem innerhalb einer Web-App lauffähig sein und den gesamten Scan-Process innerhalb einer Sekunde verarbeiten können.

Das Ergebnis ist eine leistungsfähige Technologie, die an Dritte lizenziert wird und gleichzeitig als Scan-Feature innerhalb des DMS von PaperSpace.ai Anwendung findet.

  • Erstellung und Annotation eines Datensatzes (3000 Fotos und Polygone) fürs Training von Computer-Vision-Modellen zur Erkennung von Dokumenten in Fotos
  • Erstellung einer angepassten Modell-Architektur für besonders schnelle Inferenz auch ohne GPUs
  • Deep Learning Training von zwei verschiedenen Modellen, die in der Lösung verwendet werden
  • Effiziente Implementierung mittels verschiedener AWS Lambda Funktionen in Python und C++
  • Erstellung einer API
  • Implementierung als Feature innerhalb der Web-App


Video:

  • https://youtu.be/kVzYWFy5Ysw

PaperSpace.ai Heroku AWS Bootstrap
Python C++ Bildverarbeitung Deep Learning Webentwicklung PyTorch Algorithmenentwicklung Performanceoptimierung
PaperSpace GmbH
München

Aus- und Weiterbildung

Aus- und Weiterbildung

7 Jahre
2006-10 - 2013-09

Technomathematik-Studium

Technomathematik-Diplom (Univ.) mit Diplom-Note 1,9, TU München
Technomathematik-Diplom (Univ.) mit Diplom-Note 1,9
TU München
  • Informatik
  • Elektro- und Informationstechnik
  • Maschinenbau

Klassisches Mathematikstudium mit starker praktischer Ausrichtung und besonderem Fokus auf den Einsatz der Mathematik in verschiedenen Ingenieurs-Disziplinen.

Position

Position

Ich bin Full-Stack Entwickler und Projektleiter mit Schwerpunkt auf der Entwicklung und Implementierung von Computer Vision und Machine Learning-Anwendungen.

Meine Rolle umfasst die vollständige Entwicklung, Optimierung und Bereitstellung von komplexen, angepassten Softwarelösungen, inklusive der Leitung von Projekten.

Einsatzgebiete:

  • Leitung und Umsetzung von Projekten im Bereich Computer Vision und Machine Learning
  • Full-Stack Entwicklung und Integration von Web-Anwendungen
  • Optimierung rechenintensiver Algorithmen für verschiedene Plattformen (Mobile, Web)

Kompetenzen

Kompetenzen

Top-Skills

Machine Learning Computer Vision Large Language Models Python AWS Google Cloud OCR OpenAI Algorithmenentwicklung TensorFlow PyTorch Webentwicklung Fullstack

Schwerpunkte

Computer Vision
Experte
Machine Learning
Experte
Large Language Models
Experte

Aufgabenbereiche

Entwicklung von Computer-Vision-Lösungen
Experte
Entwicklung von OCR/LLM-basierten Lösungen
Experte
Full-Stack Webentwicklung und Backend-Integration
Fortgeschritten

Produkte / Standards / Erfahrungen / Methoden

AWS
Google Cloud
Git
JIRA
Scrum

Cloud Services:

  • AWS
  • Google Cloud Platform

Entwicklungsumgebungen und Tools:

  • Git, SourceTree
  • JIRA
  • VS Code


Programmiersprachen und Frameworks:

  • Python: Numpy, OpenCV, Pandas, Jupyter
  • TensorFlow, Keras
  • PyTorch, Lightning
  • Flask, Bootstrap: Webentwicklung
  • C, C++, Objective C


Spezialisierungen:

  • Computer Vision: Entwurf, Modifikation und Test von Anwendungen zur Object Detection, Instance Segmentation u.a.
  • OCR: Pre- und Postprocessing, Verwendung verschiedener OCR-Engines in verschiedenen Anwendungsfällen
  • LLMs: Fine-Tuning, Einsatz verschiedener Prompt-Techniken
  • Algorithmische Optimierung: effiziente Lösung numerischer Probleme

Betriebssysteme

Linux
Amazon Linux
macOS

Programmiersprachen

C
Optimierter Code für Numerische Verfahren, DSP und SIMD
C++
Grundlagen
Python
Machine Learning, Prototyping, Computer Vision

Hardware

iPhone/iPad

Berechnung / Simulation / Versuch / Validierung

Data Augmentation
Analyse bestehender Datensätze, systematisches Erzeugen einer "verdichteten" Datenmenge für bessere Trainings-Ergebnisse
Trainingsdaten-Synthese
Synthetisieren von realistisch wirkenden OCR-Trainingsdaten, hat sehr kostspielige Aufbereitung und Annotation erspart

Design / Entwicklung / Konstruktion

Dokument-Erkennungs-Algorithmus
Echtzeit-Erkennung von Papierdokumenten im Kamerabild für Scan-Lösung. Basierend auf klassischen Computer-Vision-Techniken wie Edge Detection, Hough Transform
Dokumenten-Scanner-App für iOS
Design und Umsetzung einer frühen Scanner-App für iOS (zur Zeit des iPhone 4), hatte als erste solche App eine Echtzeit-Erkennung von Papierdokumenten, basierend auf einer aufwendigen OpenGL ES SL-Lösung
Künstliches Neuronales Netz
Entwurf verschiedener CNN-Model-Architekturen für Object-Detection-Anwendungen mit Fokus auf kleine Dateigröße und Anwendung auf Mobile-Geräten in Echtzeit
OCR mittels Object Detection
Modifizierung des bekannten YOLO-Object Detection-Verfahrens zur Verwendung mit sehr kleinen Bildern im Kontext einer automatischen Texterkennung
Trainings-Umgebung für Machine Learning
Entworfen für das Durchführen vielfacher experimenteller Trainings für eine Hyper-Parameter Grid Search

Managementerfahrung in Unternehmen

Aufbau eines internationalen Teams
Zusammenbringen eines 10-köpfiges Team aus Indien, Russland und München. Know-how-Transfer und erfolgreiche Zusammenarbeit nach wenigen Wochen.
Laterale Führungsverantworung
Im Rahmen eines mehrjährigen sehr R&D-lastigen Software-Entwicklungs-Projekts.

Einsatzorte

Einsatzorte

Hamburg (+50km) Berlin (+50km) Braunschweig (+50km) Hannover (+50km)
möglich

Projekte

Projekte

2 Monate
2024-04 - 2024-05

Automatische Verarbeitung von medizinischen/therapeutischen Datenblättern

Full-Stack-Entwickler OCR Handschriftenerkennung Künstliche Intelligenz ...
Full-Stack-Entwickler

Ich habe für ein Therapie-Institut den Prozess zur Erstellung von wöchentlichen Therapie-Reports aus handschriftlich beschriebenen Datenblättern digitalisiert und automatisiert. Das Ergebnis ist eine Web-App für die Therapeuten. 

Durch die Software wird eine Zeitersparnis von 1h pro Woche und Patient erreicht.

  • Erstellung einer Web-App für Erfassung der wöchentlichen Datenblätter (als Foto oder PDF) und zum Download der wöchentlichen Reports (als Excel-Datei)
  • Verbesserung der OCR-Ergebnisse durch Pre-Processing der Bilddaten
  • Verbesserung der Handschrift-OCR durch Fine-Tuning eines GPT-3.5-Turbo-Modells zur Erkennung und Korrektur von OCR-Fehlern
  • Automatische Verarbeitung aller Datenblätter zur Erstellung eines wöchentlichen Reports als Excel-Datei 


Videos (YouTube):

  • Web-App: https://youtu.be/PZ0ynKCjZRg
  • Post-Processing: https://youtu.be/RvGY9R_evtI

AWS Amazon Textract GPT-3.5 Bootstrap Heroku
OCR Handschriftenerkennung Künstliche Intelligenz Deep Learning Fine-Tuning Python Webentwicklung
Institut für Autismustherapie
(Remote)
2 Monate
2024-02 - 2024-03

Implementierung von RAG (Retrieval Augmented Generation) für ein DMS

Full-Stack-Entwickler Python OCR Vektordatenbanken ...
Full-Stack-Entwickler

Ich habe RAG (Retrieval Augmented Generation) für PaperSpace.ai implementiert, um innerhalb eines DMS beliebige Fragen zu einer Sammlung von Dokumenten beantworten zu können. Diese Technologie ermöglicht ein präzises und effiziente Informationsretrieval.

Durch dieses Feature können Nutzer schnell und zuverlässig relevante Informationen aus ihren Dokumenten extrahieren.

  • Implementierung von OCR zur Erkennung und Extraktion von Text aus Dokumenten
  • Auswahl relevanter Dokumente basierend auf den OCR-Ergebnissen
  • Berechnung der Antworten mittels eines LLMs
  • Markierung relevanter Textstellen zur visuellen Erklärung für den Benutzer


Video:

  • https://youtu.be/yvUjxE851ps

PaperSpace.ai Heroku AWS Qdrant GPT-3.5 Bootstrap
Python OCR Vektordatenbanken Vektor-Embeddings Webentwicklung
PaperSpace GmbH
München
5 Monate
2023-06 - 2023-10

Entwicklung einer Dokumenten-Scan-Technologie

Full-Stack-Entwickler Python C++ Bildverarbeitung ...
Full-Stack-Entwickler

Ich habe für PaperSpace.ai eine fortschrittliche Scan-Technologie entwickelt, die den Prozess der Digitalisierung und Verarbeitung von Dokumenten effizienter gestaltet. Die Lösung sollte mit besonders schwierigen Dokumenten wie gefalteten oder gebogenen Dokumenten aus einem Umschlag gut funktionieren und außerdem innerhalb einer Web-App lauffähig sein und den gesamten Scan-Process innerhalb einer Sekunde verarbeiten können.

Das Ergebnis ist eine leistungsfähige Technologie, die an Dritte lizenziert wird und gleichzeitig als Scan-Feature innerhalb des DMS von PaperSpace.ai Anwendung findet.

  • Erstellung und Annotation eines Datensatzes (3000 Fotos und Polygone) fürs Training von Computer-Vision-Modellen zur Erkennung von Dokumenten in Fotos
  • Erstellung einer angepassten Modell-Architektur für besonders schnelle Inferenz auch ohne GPUs
  • Deep Learning Training von zwei verschiedenen Modellen, die in der Lösung verwendet werden
  • Effiziente Implementierung mittels verschiedener AWS Lambda Funktionen in Python und C++
  • Erstellung einer API
  • Implementierung als Feature innerhalb der Web-App


Video:

  • https://youtu.be/kVzYWFy5Ysw

PaperSpace.ai Heroku AWS Bootstrap
Python C++ Bildverarbeitung Deep Learning Webentwicklung PyTorch Algorithmenentwicklung Performanceoptimierung
PaperSpace GmbH
München

Aus- und Weiterbildung

Aus- und Weiterbildung

7 Jahre
2006-10 - 2013-09

Technomathematik-Studium

Technomathematik-Diplom (Univ.) mit Diplom-Note 1,9, TU München
Technomathematik-Diplom (Univ.) mit Diplom-Note 1,9
TU München
  • Informatik
  • Elektro- und Informationstechnik
  • Maschinenbau

Klassisches Mathematikstudium mit starker praktischer Ausrichtung und besonderem Fokus auf den Einsatz der Mathematik in verschiedenen Ingenieurs-Disziplinen.

Position

Position

Ich bin Full-Stack Entwickler und Projektleiter mit Schwerpunkt auf der Entwicklung und Implementierung von Computer Vision und Machine Learning-Anwendungen.

Meine Rolle umfasst die vollständige Entwicklung, Optimierung und Bereitstellung von komplexen, angepassten Softwarelösungen, inklusive der Leitung von Projekten.

Einsatzgebiete:

  • Leitung und Umsetzung von Projekten im Bereich Computer Vision und Machine Learning
  • Full-Stack Entwicklung und Integration von Web-Anwendungen
  • Optimierung rechenintensiver Algorithmen für verschiedene Plattformen (Mobile, Web)

Kompetenzen

Kompetenzen

Top-Skills

Machine Learning Computer Vision Large Language Models Python AWS Google Cloud OCR OpenAI Algorithmenentwicklung TensorFlow PyTorch Webentwicklung Fullstack

Schwerpunkte

Computer Vision
Experte
Machine Learning
Experte
Large Language Models
Experte

Aufgabenbereiche

Entwicklung von Computer-Vision-Lösungen
Experte
Entwicklung von OCR/LLM-basierten Lösungen
Experte
Full-Stack Webentwicklung und Backend-Integration
Fortgeschritten

Produkte / Standards / Erfahrungen / Methoden

AWS
Google Cloud
Git
JIRA
Scrum

Cloud Services:

  • AWS
  • Google Cloud Platform

Entwicklungsumgebungen und Tools:

  • Git, SourceTree
  • JIRA
  • VS Code


Programmiersprachen und Frameworks:

  • Python: Numpy, OpenCV, Pandas, Jupyter
  • TensorFlow, Keras
  • PyTorch, Lightning
  • Flask, Bootstrap: Webentwicklung
  • C, C++, Objective C


Spezialisierungen:

  • Computer Vision: Entwurf, Modifikation und Test von Anwendungen zur Object Detection, Instance Segmentation u.a.
  • OCR: Pre- und Postprocessing, Verwendung verschiedener OCR-Engines in verschiedenen Anwendungsfällen
  • LLMs: Fine-Tuning, Einsatz verschiedener Prompt-Techniken
  • Algorithmische Optimierung: effiziente Lösung numerischer Probleme

Betriebssysteme

Linux
Amazon Linux
macOS

Programmiersprachen

C
Optimierter Code für Numerische Verfahren, DSP und SIMD
C++
Grundlagen
Python
Machine Learning, Prototyping, Computer Vision

Hardware

iPhone/iPad

Berechnung / Simulation / Versuch / Validierung

Data Augmentation
Analyse bestehender Datensätze, systematisches Erzeugen einer "verdichteten" Datenmenge für bessere Trainings-Ergebnisse
Trainingsdaten-Synthese
Synthetisieren von realistisch wirkenden OCR-Trainingsdaten, hat sehr kostspielige Aufbereitung und Annotation erspart

Design / Entwicklung / Konstruktion

Dokument-Erkennungs-Algorithmus
Echtzeit-Erkennung von Papierdokumenten im Kamerabild für Scan-Lösung. Basierend auf klassischen Computer-Vision-Techniken wie Edge Detection, Hough Transform
Dokumenten-Scanner-App für iOS
Design und Umsetzung einer frühen Scanner-App für iOS (zur Zeit des iPhone 4), hatte als erste solche App eine Echtzeit-Erkennung von Papierdokumenten, basierend auf einer aufwendigen OpenGL ES SL-Lösung
Künstliches Neuronales Netz
Entwurf verschiedener CNN-Model-Architekturen für Object-Detection-Anwendungen mit Fokus auf kleine Dateigröße und Anwendung auf Mobile-Geräten in Echtzeit
OCR mittels Object Detection
Modifizierung des bekannten YOLO-Object Detection-Verfahrens zur Verwendung mit sehr kleinen Bildern im Kontext einer automatischen Texterkennung
Trainings-Umgebung für Machine Learning
Entworfen für das Durchführen vielfacher experimenteller Trainings für eine Hyper-Parameter Grid Search

Managementerfahrung in Unternehmen

Aufbau eines internationalen Teams
Zusammenbringen eines 10-köpfiges Team aus Indien, Russland und München. Know-how-Transfer und erfolgreiche Zusammenarbeit nach wenigen Wochen.
Laterale Führungsverantworung
Im Rahmen eines mehrjährigen sehr R&D-lastigen Software-Entwicklungs-Projekts.

Vertrauen Sie auf GULP

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das GULP Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.