Spezialist: KI-Experte / Data Analyst / Data Engineer

Mitarbeiter eines Dienstleisters

Remote-Arbeit

Verf�gbar ab: 02.07.2024

Verf�gbar zu: 80%

davon vor Ort: 100%

Corporate-Profil

Skill-Profil eines fest angestellten Mitarbeiters des Dienstleisters

Sprachen

Deutsch

Rum�nisch

Englisch

Einsatzorte

L�nder

Deutschland, Schweiz, �sterreich

Remote-Arbeit

m�glich

Projekte

3 Monate

2023-10 - 2023-12

Web-Scraping und �bersetzung Automobilteile

Dateningenieur Web-Scraping mit Selenium und Beautiful Soup SEO-Optimierung Integration effektiver Updatemechanismen f�r Produktinformationen ...

Rolle

Dateningenieur

Projektinhalte

Im Rahmen dieses Projekts wurde ein Web-Scraping- und �bersetzungsmechanismus entwickelt, um detaillierte Informationen �ber mehr als 50.000 Automobilteile f�r einen Online-Marktplatz zu sammeln und zu verarbeiten.
Ziel war es, eine effiziente L�sung zur Automatisierung der Datenerfassung und der anschlie�enden �bersetzung ins Deutsche zu implementieren, um die Pr�sentation und Suche der Produkte f�r den europ�ischen Markt zu optimieren. Dies beinhaltete den Einsatz von Technologien wie Selenium und Beautiful Soup f�r Web-Scraping und das Parsen der Daten. Im Rahmen des Projektes wurden ma�geschneiderte spezialisierte Algorithmen zur �bersetzung und Kategorisierung der Produktinformationen entwickelt.
- Entwicklung und Implementierung eines automatisierten Web-Scraping-Systems mit Selenium und�Beautiful Soup
- Verarbeitung und �bersetzung von �ber 50.000 Produktinformationen ohne Nutzung von �bersetzungs-APIs
- Optimierung des Logistikprozesses basierend auf den gesammelten Daten
- Durchf�hrung von Marktanalysen zur kontinuierlichen Verbesserung des Angebots

Kenntnisse

Web-Scraping mit Selenium und Beautiful Soup SEO-Optimierung Integration effektiver Updatemechanismen f�r Produktinformationen Marktanalyse und Anpassung an Kundenbed�rfnisse Effektive Produktkategorisierung Fachgerechte �bersetzung von Produktinformationen ins Deutsche Optimierung von �bersetzungsprozessen f�r Produktinformationen Qualit�tskontrolle von gesammelten Daten

Kunde

Automobil/ Ersatzteile

Einsatzort

Deutschland

2 Jahre 5 Monate

2021-08 - 2023-12

MiMoText und ReCap

Wissenschaftliche Hilfskraft Web-Scraping und Regex Data Mining und Datenanalyse Exception handling ...

Rolle

Wissenschaftliche Hilfskraft

Projektinhalte

Beteiligung an der ReCAP-Initiative und dem MiMoText-Projekt zur Unterst�tzung von ETL/ELT-Prozessen. Dies umfasste die Sammlung, Analyse, Transformation und Verwaltung von Daten. Die Arbeit beinhaltete die enge Zusammenarbeit mit dem Data Science Team und dem Annotations Team, um Skripte f�r einen semiautomatisierten Workflow zu entwickeln, was eine deutliche Beschleunigung der Annotationsgeschwindigkeit zur Folge hatte.
Das ReCAP-Projekt identifizierte und analysierte Argumentationsmuster in umfangreichen Textdaten, f�rderte das Verst�ndnis rhetorischer Techniken und trieb die Entwicklung neuer Textanalyse-Algorithmen voran. Das MiMoText-Projekt optimierte den Umgang mit digitalen Textsammlungen durch neue fortschrittliche Datenmodellierung und Erschlie�ung neuer Analysemethoden, was die wissenschaftliche Forschung in den Geisteswissenschaften wesentlich bereicherte.
- Bereitstellung von ETL/ELT-Support f�r die Publikationen, sowie f�r die literaturgeschichtliche�Textsammlungsanalyse im Linked-Open-Data Kontext.
- Entwicklung von Skripten mit dem Annotations Team f�r einen semi-automatisierten Workflow im MiMoText-Projekt.
- Unterst�tzung aller Teams bei Fragen zur Datenqualit�t, Annotationsprozessen, feature engineering, Regex und Edge-Cases.

Kenntnisse

Web-Scraping und Regex Data Mining und Datenanalyse Exception handling Feature Engineering Linguistische Expertise Modellierung literarischer Texte und Sekund�rliteratur (LOD) Annotation-Prozess Optimierung Computational Argumentation

Kunde

Forschung/ Datenwissenschaft

Einsatzort

Deutschland

5 Monate

2023-03 - 2023-07

Argument-Mining aus Podcasts mit ChatGPT

Prompt Engineering: ChatGPT GPT-4 Adobe Audition Adobe Media Encoder ...

Projektinhalte

Entwicklung eines neuartigen Ansatzes zum Extrahieren argumentativer Strukturen aus Podcasts nach deren Transkription. Die Studie umfasst die Transkription von drei Podcasts zu unterschiedlichen Themen, um die Vielseitigkeit der Methode zu demonstrieren. Die Herausforderung bestand darin, die unstrukturierte und informelle Natur von Podcasts zu bew�ltigen. OpenAI?s GPT-4 wurde verwendet, um Argumentationsstrukturen aus den transkribierten Texten zu extrahieren, um die Machbarkeit und Effektivit�t dieses Ansatzes in der computergest�tzten Argumentation zu beweisen.

Transkription von Podcast-Episoden mit OpenAI?s Whisper
Entwicklung spezieller Prompts zur Identifizierung argumentativer Strukturen mittels OpenAI?s GPT-4
Analyse und Auswertung der von GPT-4 extrahierten Argumentstrukturen
Ver�ffentlichung eines Datensatzes mit ca. 1500 transkribierten Podcast-Episoden
Messung und Analyse der Effektivit�t des Ansatzes anhand spezifischer Metriken (z.B. Handle Accuracy, Stance Quality, Semantic Coverage)

Kenntnisse

Prompt Engineering: ChatGPT GPT-4 Adobe Audition Adobe Media Encoder Argument Mining Web-Scraping Speech Processing: Whisper; Librosa; NeMo; Speechbrain

Kunde

Universit�t Trier

4 Monate

2022-01 - 2022-04

Kategorisierung politischer Statements entlang des Spektrums durch Machine Learning

Natural Language Processing (NLP) Support Vector Machines Sentence Transformers ...

Projektinhalte

Entwicklung und Anwendung von Machine Learning Techniken zur Einordnung von Aussagen entlang des politischen Spektrums, um die politische Position des Verfassers bzw. des Textes zu bestimmen. Im Projekt wurden daf�r die Beziehungen zwischen lexikalisch-semantischen Strukturen und politischer Ausrichtung untersucht. Grundlage hierf�r war eine Analyse deutscher Parteiprogramme. Support Vector Machines und Sentence Transformer wurden verwendet, um Muster und Trends in der Verwendung politisch relevanter Begriffe zu identifizieren und zu klassifizieren. Die Auswahl der Statements und Klassifikation erfolgte auf Basis der Methodologie und Fragestellungen des Wahl-O-Mat Tools.

Extraktion von Schl�sselbegriffen aus Parteiprogrammen zur Analyse ihrer politischen Ausrichtung
Anwendung von Support Vector Machines zur Klassifizierung und Vergleich der politischen Statements
Einsatz von Sentence Transformers zur Verbesserung der Kontextualisierung der Textanalyse
Entwicklung von Algorithmen zur Erkennung, Analyse, Auswertung und Visualisierung politischer Muster

Kenntnisse

Natural Language Processing (NLP) Support Vector Machines Sentence Transformers Text Mining und Datenvisualisierung Analyse politischer Programme Lexikalisch-semantische Analyse

Kunde

Universit�t Trier

Aus- und Weiterbildung

2022 ? 2023
Studium - Natural Language Processing
Universit�t Trier
Abschluss: Master of Science

2017 ? 2022
Studium - Anglistik und Phonetik
Universit�t Trier
Abschluss: B.A.

FORTBILDUNGEN & ZERTIFIZIERUNGEN

IBM Certified Python Programmer for Data Science and AI Development

Position

KI-Experte
Data Analyst
Data Engineer

Kompetenzen

Schwerpunkte

Natural Language Processing, z.B. mit Whisper, Speechbrain
Generative KI und Large Language Models (LLMs), z.B. mit GPT-4, LangChain, Hugging Face
Web Scraping, z.B. mit Selenium, Beautiful Soup
ETL/ELT, z.B. mit Python, Apache Airflow, Apache Spark

Aufgabenbereiche

Anforderungsanalyse

Datenanalyse/ -visualisierung

Infromation Retrieval, Data Mining

Data Warehousing

Datenbankadministration

Graphdatenbanken und Linked-Open-Data (LOD)

ETL/ ELT

Speech Processing

Large Language Models (LLM)

Prompt Engieering

Natural Language Processing (NLP)

Data Science/ Machine Learning (ML)

Produkte / Standards / Erfahrungen / Methoden

Profil

Der Mitarbeiter bietet erprobte Kenntnisse mit den modernsten Technologien im Bereich der K�nstlichen Intelligenz und der Verarbeitung nat�rlicher Sprache (NLP). Dabei bringt er umfangreiche F�higkeiten von der Erfassung der Daten mittels Web Scraping �ber das Speichern und Verwalten bis hin zur Analyse und Generierung von Erkenntnissen mit.
In einem Zeitalter, in dem Daten das neue Gold sind, hat er sich als herausragendes Naturtalent auf dem Gebiet der Datenverarbeitung und der k�nstlichen Intelligenz, insbesondere im sprachwissenschaftlichen Kontext, erwiesen.
Schon w�hrend seiner akademischen Laufbahn besch�ftigte er sich intensiv mit dem Thema K�nstliche Intelligenz und der Verarbeitung nat�rlicher Sprache, wo er mit seinem linguistischen Hintergrund innovative Perspektiven einbrachte.
Er entwickelte etwa das erste Verfahren zur Argumentdatengewinnung mittels GPT-4 und leistete bedeutende Beitr�ge zur Methodik der Analyse gro�er Textsammlungen (Linked-Open-Data).
Durch die intensive Arbeit mit Transformer-Modellen und offenen Daten hat er eine tiefe Datenkompetenz entwickelt, die ihn besonders in den Feldern Web-Scraping, Prompt Engineering, Data Engineering, Datenanalyse und -normalisierung sowie Laufzeitoptimierung auszeichnet.
Der Mitarbeiter zeichnet sich nicht allein durch seine umfangreiche Fachexpertise aus, sondern auch durch seine besondere F�higkeit, interdisziplin�re Verbindungen herzustellen und innovative Ans�tze zu entwickeln. Er strebt danach, sein tiefgreifendes Wissen und seine vielf�ltigen Erfahrungen zielgerichtet in neuen Projekten einzubringen und so wertvolle Beitrage zu leisten und neue Ma�st�be zu setzen. Seine hohe Motivation und sein Engagement machen ihn zu einem wertvollen Teammitglied, das wir gerne weiterempfehlen.

TECHNOLOGIEN & PRODUKTE

Data Engineering und Analyse
- pandas, spaCy
- Beautiful Soup, Selenium
- Matplotlib, Seaborn
- Apache Spark
- Apache Airflow
- Calc, Excel
Stimm- und Signalverarbeitung
- OpenAI Whisper
- NVIDIA NeMo
- Speechbrain
- Adobe Audition
- Praat
- Librosa
- SciPy
KI- und Machine Learning
- ChatGPT GPT-4
- Huggingface
- scikit-learn, Pytorch
- Langchain
- OpenCV, OpenAI GPT-4V (Vision), DALL-E 3
Entwicklungsumgebung
- MS Visual Studio Code
- Anaconda, Jupyter Notebook
- Git
- ?Poetry

BERUFLICHER WERDEGANG

2024 - heute
Firma: auf Anfrage

2024 - heute
Position: Datenigenieur�
Firma: auf Anfrage

2021 - 2024
Position: Wissenschaftliche Hilfskraft�
Firma: Lehrstuhl Informationswissenschaften und Datenbanken, Universit�t Trier

Betriebssysteme

Windows

GNU/ Linux

Programmiersprachen

Python

Scala

Java

Bash

Datenbanken

PostgreSQL

MySQL

Neo4j

Einsatzorte

L�nder

Deutschland, Schweiz, �sterreich

Remote-Arbeit

m�glich

Projekte

3 Monate

2023-10 - 2023-12

Web-Scraping und �bersetzung Automobilteile

Dateningenieur Web-Scraping mit Selenium und Beautiful Soup SEO-Optimierung Integration effektiver Updatemechanismen f�r Produktinformationen ...

Rolle

Dateningenieur

Projektinhalte

Im Rahmen dieses Projekts wurde ein Web-Scraping- und �bersetzungsmechanismus entwickelt, um detaillierte Informationen �ber mehr als 50.000 Automobilteile f�r einen Online-Marktplatz zu sammeln und zu verarbeiten.
Ziel war es, eine effiziente L�sung zur Automatisierung der Datenerfassung und der anschlie�enden �bersetzung ins Deutsche zu implementieren, um die Pr�sentation und Suche der Produkte f�r den europ�ischen Markt zu optimieren. Dies beinhaltete den Einsatz von Technologien wie Selenium und Beautiful Soup f�r Web-Scraping und das Parsen der Daten. Im Rahmen des Projektes wurden ma�geschneiderte spezialisierte Algorithmen zur �bersetzung und Kategorisierung der Produktinformationen entwickelt.
- Entwicklung und Implementierung eines automatisierten Web-Scraping-Systems mit Selenium und�Beautiful Soup
- Verarbeitung und �bersetzung von �ber 50.000 Produktinformationen ohne Nutzung von �bersetzungs-APIs
- Optimierung des Logistikprozesses basierend auf den gesammelten Daten
- Durchf�hrung von Marktanalysen zur kontinuierlichen Verbesserung des Angebots

Kenntnisse

Kunde

Automobil/ Ersatzteile

Einsatzort

Deutschland

2 Jahre 5 Monate

2021-08 - 2023-12

MiMoText und ReCap

Wissenschaftliche Hilfskraft Web-Scraping und Regex Data Mining und Datenanalyse Exception handling ...

Rolle

Wissenschaftliche Hilfskraft

Projektinhalte

Beteiligung an der ReCAP-Initiative und dem MiMoText-Projekt zur Unterst�tzung von ETL/ELT-Prozessen. Dies umfasste die Sammlung, Analyse, Transformation und Verwaltung von Daten. Die Arbeit beinhaltete die enge Zusammenarbeit mit dem Data Science Team und dem Annotations Team, um Skripte f�r einen semiautomatisierten Workflow zu entwickeln, was eine deutliche Beschleunigung der Annotationsgeschwindigkeit zur Folge hatte.
Das ReCAP-Projekt identifizierte und analysierte Argumentationsmuster in umfangreichen Textdaten, f�rderte das Verst�ndnis rhetorischer Techniken und trieb die Entwicklung neuer Textanalyse-Algorithmen voran. Das MiMoText-Projekt optimierte den Umgang mit digitalen Textsammlungen durch neue fortschrittliche Datenmodellierung und Erschlie�ung neuer Analysemethoden, was die wissenschaftliche Forschung in den Geisteswissenschaften wesentlich bereicherte.
- Bereitstellung von ETL/ELT-Support f�r die Publikationen, sowie f�r die literaturgeschichtliche�Textsammlungsanalyse im Linked-Open-Data Kontext.
- Entwicklung von Skripten mit dem Annotations Team f�r einen semi-automatisierten Workflow im MiMoText-Projekt.
- Unterst�tzung aller Teams bei Fragen zur Datenqualit�t, Annotationsprozessen, feature engineering, Regex und Edge-Cases.

Kenntnisse

Kunde

Forschung/ Datenwissenschaft

Einsatzort

Deutschland

5 Monate

2023-03 - 2023-07

Argument-Mining aus Podcasts mit ChatGPT

Prompt Engineering: ChatGPT GPT-4 Adobe Audition Adobe Media Encoder ...

Projektinhalte

Transkription von Podcast-Episoden mit OpenAI?s Whisper
Entwicklung spezieller Prompts zur Identifizierung argumentativer Strukturen mittels OpenAI?s GPT-4
Analyse und Auswertung der von GPT-4 extrahierten Argumentstrukturen
Ver�ffentlichung eines Datensatzes mit ca. 1500 transkribierten Podcast-Episoden
Messung und Analyse der Effektivit�t des Ansatzes anhand spezifischer Metriken (z.B. Handle Accuracy, Stance Quality, Semantic Coverage)

Kenntnisse

Prompt Engineering: ChatGPT GPT-4 Adobe Audition Adobe Media Encoder Argument Mining Web-Scraping Speech Processing: Whisper; Librosa; NeMo; Speechbrain

Kunde

Universit�t Trier

4 Monate

2022-01 - 2022-04

Kategorisierung politischer Statements entlang des Spektrums durch Machine Learning

Natural Language Processing (NLP) Support Vector Machines Sentence Transformers ...

Projektinhalte

Extraktion von Schl�sselbegriffen aus Parteiprogrammen zur Analyse ihrer politischen Ausrichtung
Anwendung von Support Vector Machines zur Klassifizierung und Vergleich der politischen Statements
Einsatz von Sentence Transformers zur Verbesserung der Kontextualisierung der Textanalyse
Entwicklung von Algorithmen zur Erkennung, Analyse, Auswertung und Visualisierung politischer Muster

Kenntnisse

Natural Language Processing (NLP) Support Vector Machines Sentence Transformers Text Mining und Datenvisualisierung Analyse politischer Programme Lexikalisch-semantische Analyse

Kunde

Universit�t Trier

Aus- und Weiterbildung

IBM Certified Python Programmer for Data Science and AI Development

Position

KI-Experte
Data Analyst
Data Engineer

Kompetenzen

Schwerpunkte

Natural Language Processing, z.B. mit Whisper, Speechbrain
Generative KI und Large Language Models (LLMs), z.B. mit GPT-4, LangChain, Hugging Face
Web Scraping, z.B. mit Selenium, Beautiful Soup
ETL/ELT, z.B. mit Python, Apache Airflow, Apache Spark

Aufgabenbereiche

Anforderungsanalyse

Datenanalyse/ -visualisierung

Infromation Retrieval, Data Mining

Data Warehousing

Datenbankadministration

Graphdatenbanken und Linked-Open-Data (LOD)

ETL/ ELT

Speech Processing

Large Language Models (LLM)

Prompt Engieering

Natural Language Processing (NLP)

Data Science/ Machine Learning (ML)

Produkte / Standards / Erfahrungen / Methoden

Profil

Der Mitarbeiter bietet erprobte Kenntnisse mit den modernsten Technologien im Bereich der K�nstlichen Intelligenz und der Verarbeitung nat�rlicher Sprache (NLP). Dabei bringt er umfangreiche F�higkeiten von der Erfassung der Daten mittels Web Scraping �ber das Speichern und Verwalten bis hin zur Analyse und Generierung von Erkenntnissen mit.
In einem Zeitalter, in dem Daten das neue Gold sind, hat er sich als herausragendes Naturtalent auf dem Gebiet der Datenverarbeitung und der k�nstlichen Intelligenz, insbesondere im sprachwissenschaftlichen Kontext, erwiesen.
Schon w�hrend seiner akademischen Laufbahn besch�ftigte er sich intensiv mit dem Thema K�nstliche Intelligenz und der Verarbeitung nat�rlicher Sprache, wo er mit seinem linguistischen Hintergrund innovative Perspektiven einbrachte.
Er entwickelte etwa das erste Verfahren zur Argumentdatengewinnung mittels GPT-4 und leistete bedeutende Beitr�ge zur Methodik der Analyse gro�er Textsammlungen (Linked-Open-Data).
Durch die intensive Arbeit mit Transformer-Modellen und offenen Daten hat er eine tiefe Datenkompetenz entwickelt, die ihn besonders in den Feldern Web-Scraping, Prompt Engineering, Data Engineering, Datenanalyse und -normalisierung sowie Laufzeitoptimierung auszeichnet.
Der Mitarbeiter zeichnet sich nicht allein durch seine umfangreiche Fachexpertise aus, sondern auch durch seine besondere F�higkeit, interdisziplin�re Verbindungen herzustellen und innovative Ans�tze zu entwickeln. Er strebt danach, sein tiefgreifendes Wissen und seine vielf�ltigen Erfahrungen zielgerichtet in neuen Projekten einzubringen und so wertvolle Beitrage zu leisten und neue Ma�st�be zu setzen. Seine hohe Motivation und sein Engagement machen ihn zu einem wertvollen Teammitglied, das wir gerne weiterempfehlen.

TECHNOLOGIEN & PRODUKTE

Data Engineering und Analyse
- pandas, spaCy
- Beautiful Soup, Selenium
- Matplotlib, Seaborn
- Apache Spark
- Apache Airflow
- Calc, Excel
Stimm- und Signalverarbeitung
- OpenAI Whisper
- NVIDIA NeMo
- Speechbrain
- Adobe Audition
- Praat
- Librosa
- SciPy
KI- und Machine Learning
- ChatGPT GPT-4
- Huggingface
- scikit-learn, Pytorch
- Langchain
- OpenCV, OpenAI GPT-4V (Vision), DALL-E 3
Entwicklungsumgebung
- MS Visual Studio Code
- Anaconda, Jupyter Notebook
- Git
- ?Poetry

Betriebssysteme

Windows

GNU/ Linux

Programmiersprachen

Python

Scala

Java

Bash

Datenbanken

PostgreSQL

MySQL

Neo4j

Vertrauen Sie auf Randstad

Im Bereich Freelancing

Im Bereich Arbeitnehmer�berlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Name E-Mail-Adresse Ihre Frage

Telefonnummer Unternehmen

Ich habe die Datenschutzbestimmungen gelesen und bin damit einverstanden.

Einsatzorte

Projekte

Aus- und Weiterbildung

Position

Kompetenzen

Schwerpunkte

Aufgabenbereiche

Produkte / Standards / Erfahrungen / Methoden

Betriebssysteme

Programmiersprachen

Datenbanken

Einsatzorte

Projekte

Aus- und Weiterbildung

Position

Kompetenzen

Schwerpunkte

Aufgabenbereiche

Produkte / Standards / Erfahrungen / Methoden

Betriebssysteme

Programmiersprachen

Datenbanken

Vertrauen Sie auf Randstad

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.