Data & AI Engineer (m/w/d)

Remote Full-time
Wir sind das Team Passerelle, eine 2025 in Berlin gegründete KI-Beratung aus dem gewerkschaftlichen Umfeld. Unser Name ist Programm: Passerelle bedeutet Brücke. Wir sind angetreten, um inmitten der größten Transformation der Arbeitswelt genau diese Brücke in die Zukunft zu bauen - eine Brücke, die echten technologischen Fortschritt ermöglicht und gleichzeitig bessere Arbeitsbedingungen schafft. All das machen wir unter dem Leitsatz: Gute KI. Gute Arbeit.

Gegründet von erfahrenen Köpfen aus der Tech- und Beratungswelt sowie der angewandten KI-Wissenschaft, verbinden wir strategischen C-Level-Weitblick mit tiefem technologischem Sachverstand. Wir begleiten Organisationen und Institutionen auf ihrem Weg in eine KI-geprägte Zukunft, von der strategischen Beratung über die werteorientierte technische Implementierung bis zur nachhaltigen Adoption im Betrieb. Neben unseren Transformationsmandaten entwickeln wir außerdem eigene Software-Produkte für digitale Souveränität.

Aufgaben

Als Data & AI Engineer schaffst du bei uns die zwingende technische Voraussetzung für jeden erfolgreichen KI-Einsatz: eine belastbare und strukturierte Datenbasis. Dein Schwerpunkt liegt darauf, historisch gewachsene, heterogene Datenlandschaften zu erschließen und für moderne KI-Anwendungen, insbesondere Retrieval-Systeme, nutzbar zu machen.

Als eine:r der ersten dedizierten Engineering-Hires gestaltest du den Aufbau unserer technischen Umsetzungskraft mit – eng an der Seite unseres AI Solutions Architect. Dein Tätigkeitsfeld umfasst zwei Bereiche: In unseren Beratungsmandaten analysierst du die bestehende Datenarchitektur, deckst Lücken auf und legst das Fundament für die KI-Strategie. Parallel dazu entwickelst du die Daten- und Retrieval-Pipelines für unsere eigene KI-Infrastruktur und Software-Produkte.

**
Deine Aufgaben**

Datenbestandsaufnahme & Reifegrad: Du erstellst Datenlandkarten über heterogene Bestände hinweg und bewertest den Reifegrad des digitalen Fundaments. Deine Lückenanalysen zu Identifikatoren und Metadaten zeigen präzise, wo der Hebel liegt.

AI Data Ingestion (KI-Enablement): Du erschließt unstrukturierte Datenquellen (PDFs, Berichte, Publikationen) für die Nutzung in KI-Systemen – Text-Extraktion, Chunking-Strategien, Metadaten-Generierung, z. B. mit Werkzeugen wie LlamaParse oder Unstructuredio.

Datenfundament & Retrieval: Du entwickelst Metadaten- und Identifikatorkonzepte, Datenmodelle und Embedding-Pipelines und baust die Retrieval-Grundlage für RAG-Anwendungen – inklusive Befüllung und Betrieb von Vektordatenbanken (z. B. Qdrant, Weaviate, pgvector). Die Qualität dieser Grundlage bewertest du systematisch.

Datenschutz & Souveränität: Du gehst verantwortungsvoll mit sensiblen Daten um und stimmst dich eng zu AI-Governance-, Datenschutz, EU AI Act und Souveränitätsanforderungen ab. Datensparsamkeit und Schutzwürdigkeit denkst du von Anfang an mit.

Pipelines für interne Software-Entwicklung: Du baust und betreibst perspektivisch die Ingest- und Retrieval-Pipelines für eigene Software-Produkte – mit DataOps-Mindset (Versioning, Testing, Observability) und einem Verständnis agentischer Muster inkl. Human-in-the-loop.

Qualifikation

Fundierte Data-Engineering-Erfahrung: Mehrjährige (3+ Jahre) im Data Engineering oder als Data Platform Engineer – idealerweise in gewachsenen, heterogenen Datenlandschaften. Exzellentes Python und SQL sowie sicherer Umgang mit dem Modern Data Stack (z. B. dbt, Airflow, Dagster) und ETL-/ELT-Prozessen.

KI-Enablement: Praktische Erfahrung mit Embedding-Pipelines und Vektordatenbanken (z. B. Qdrant, Weaviate, Milvus, pgvector), ein Gespür für Retrieval-Strategien und Erfahrung mit der Erschließung unstrukturierter Daten (z. B. LlamaParse, Unstructuredio).

Datenschutz-Bewusstsein: Erfahrung im verantwortungsvollen Umgang mit sensiblen und personenbezogenen Daten sowie Kenntnis der einschlägigen Anforderungen (insb. DSGVO, EU-AI-Act-Awareness).

Pragmatismus bei realer Datenlage: Du fühlst dich in unvollständigen, gewachsenen Datenbeständen wohl und weißt, dass ein nutzbares Datenmodell mehr wert ist als ein perfektes. Du priorisierst, wo es zählt.

Kommunikationsstärke & Haltung: Du übersetzt die Datenrealität verständlich für nicht-technische Stakeholder und kommunizierst auf Augenhöhe mit Fachbereichen. Dein Deutsch und Englisch ist verhandlungssicher. Du steuerst dich selbst, denkst lösungsorientiert und teilst unsere Werte rund um eine gerechte Arbeitswelt von morgen.

Schön, wenn du zusätzlich mitbringst: Erfahrung mit Knowledge Graphs, Semantic Layer oder Text-to-SQL; ausgeprägtes DataOps-Mindset; Lust an PoCs mitzubauen

Benefits

Echter Impact & Haltung: Ein Arbeitsumfeld, das technologische Innovation mit gesellschaftlicher Verantwortung und nachhaltigen Werten verbindet. Du gestaltest die KI-Transformation an vorderster Front nach europäischen, demokratischen Werten.

Sichtbarkeit & Netzwerk: Einblicke in hochkarätige Mandate aus Politik, Wirtschaft und Gewerkschaften

Hohe Autonomie: Flache Strukturen, die bewusste Abwesenheit von Mikromanagement und echte Verantwortung für deine Accounts und Themen

Flexibles Set-up: Remote-first mit einem Kernteam in Berlin sowie flexiblen Arbeitszeiten, die zu deinem Leben passen.

Standards: 30 Tage Urlaub, ein eigenes Weiterbildungsbudget und modernste Arbeitsausstattung

Faire Vergütung: Ein transparentes Gehaltsband von 80.000 bis 95.000 € brutto p.a. auf Basis einer 40h Woche (je nach Erfahrung)

* Langfristige Perspektive: Die Stelle ist aufgrund unserer agilen Startup-Phase zunächst auf ein Jahr befristet. Da wir uns im nachhaltigen Aufbau befinden, ist eine langfristige Zusammenarbeit unser klares Ziel. Eine Verlängerung oder Entfristung wird bei entsprechender Mandats- und Geschäftsentwicklung ausdrücklich angestrebt.

Der Kern unserer Arbeit ist die sozialpartnerschaftliche Gestaltung der KI-Transformation - von der fairen Verteilung von Produktivitätsgewinnen über die digitale Souveränität bis hin zur Frage, wie wir eine gerechte Arbeitswelt von morgen bauen. Wir brennen für diese Themen und wollen diese Brücke in die Zukunft nicht nur theoretisch durchdenken, sondern ganz praktisch bauen.

Dafür suchen wir kluge Köpfe mit Haltung und Can-Do-Attitude, die um die Ecke denken und keine Angst haben, Annahmen zu hinterfragen. Bewirb dich ausdrücklich auch dann, wenn dein Lebenslauf nicht perfekt auf die Beschreibung passt - für uns zählen deine Perspektive und dein innerer Antrieb weit mehr als ein lückenloses Profil. Wenn du Lust hast, ein junges Unternehmen mitzuprägen und der Zukunft der Arbeit deinen Stempel aufzudrücken: Join us!
Apply Now →

Similar Jobs

Experienced Registered Behavior Technician for In-Home ABA Therapy - Atlanta, GA

Remote

Immediate Hiring: Experienced Registered Behavioral Technician (RBT) for Clinic-Based ABA Therapy Services

Remote

Experienced Registered Behavioral Technician (RBT) - ABA Therapy for Children with Autism Spectrum Disorder

Remote

Experienced Registered Nurse - Telehealth: Providing Remote Care Coordination and Patient Support

Remote

Experienced Substitute Teacher for Riverside County Schools - Join Scoot Education's Innovative Team

Remote

Experienced Substitute Teacher for San Bernardino County - Flexible Schedules & Competitive Pay

Remote

Experienced School Year Instructional Coach for High-Dosage Tutoring Programs in Edgewater Park, NJ

Remote

Experienced School Year Tutor for K-8 Students in Math and Literacy - Mickleton, NJ

Remote

Experienced Secondary Social Studies Teacher for Kansas - Flexible Hybrid Remote Arrangement

Remote

USPS Office Helper

Remote

Experienced Remote Data Entry Specialist – Work From Home Opportunity with arenaflex for High Accuracy and Efficiency in Data Management

Remote

Quality of Earnings (QoE) Consultant Needed for Financial Analysis & Reporting

Remote

Senior Creative Manager

Remote

Experienced Remote Data Entry Specialist – Full Time, Entry Level Opportunity for Detail-Oriented Individuals in Logistics and Transportation Industry

Remote

UX/UI Graphic Designer

Remote

Sports Management Internship

Remote

Security Policy & Compliance Analyst

Remote

**Experienced Telecommute Chat and Email Advisor – Delivering Exceptional Customer Service in a Remote Setting**

Remote

Remote Call Center Customer Service Representative – $25/Hour | Virtual Customer Support Specialist at arenaflex

Remote

Quality Assurance Analyst, Seasonal

Remote
← Back