Blueprint

Blueprint · IHK Präsentation 2026

DocFlow.
Vom Aktenordner zum digitalen Assistenten.

Eine plattformübergreifende Software, die Dokumente mit moderner KI automatisch erkennt, klassifiziert, zusammenfasst und in der Cloud des Anwenders ablegt — vollständig DSGVO-konform.

Native iOS & Android Web-PWA DSGVO-konform Hosted Frankfurt
Dokument OCR KI Cloud Chat Upload · Scan VisionKit Gemini 2.5 Drive · Dropbox Antwort
01 · Marktanalyse

Ein Markt, der jedes Jahr wächst.

Digitalisierung ist in Deutschland längst Pflicht, nicht Kür. KMU, Selbstständige und Privathaushalte stehen unter steigendem Druck. Gleichzeitig wächst der Markt für KI-gestützte Dokumenten-Software zweistellig.

0
täglich pro Mitarbeiter mit Dokumentensuche verlorenMcKinsey-Studie
0
Produktivitätsverlust pro Mitarbeiter & JahrGartner-Studie
0
KMU in DeutschlandStatistisches Bundesamt 2024
0
jährliches Wachstum DMS-MarktGrand View Research

Marktvolumen Document-Management & AI Software

Deutschland, Prognose in Mrd. € · Quelle: Statista / IDC-Aggregat

2022
2023
2024
2025
2026
2027e

Regulatorischer Druck

E-Rechnungs-Pflicht ab Januar 2025, GoBD-Aufbewahrungspflicht 10 Jahre, DSGVO-Compliance — Unternehmen brauchen revisionssichere Dokumenten-Workflows.

KI als Katalysator

Sprachmodelle wie Gemini 2.5 ermöglichen heute, was vor zwei Jahren noch undenkbar war: automatische Klassifikation, Volltextsuche im Chat, Frist-Erkennung.

Privatkunden als Zweitmarkt

Über 10 Millionen Haushalte in Deutschland managen Verträge, Versicherungen und Steuerunterlagen manuell — das gleiche KI-System lässt sich ohne Aufwand auf B2C ausspielen.

Wettbewerb fragmentiert

DATEV, sevDesk & Co. bedienen Buchhaltung, nicht den Alltag. DocFlow positioniert sich als KI-First-Assistent zwischen Privatperson und Steuerberater.

02 · Produkt

Sechs Bausteine, ein System.

Jede Funktion stiftet einzeln einen klaren Nutzen. Gemeinsam ergeben sie einen vollständigen digitalen Dokumenten-Assistenten.

DocFlow App-Übersicht
98 %Treffgenauigkeit
< 30 Sekpro Dokument
  • Dashboard & Übersicht

    Alle Dokumente, Fristen und Kostenkennzahlen auf einen Blick — sofort sichtbar wo Handlungsbedarf besteht.

  • Automatische Klassifikation

    KI erkennt Rechnungen, Verträge, Korrespondenz, Belege. Benennt, sortiert, archiviert — ohne manuelles Tagging.

  • Chat mit deinen Dokumenten

    „Was zahle ich monatlich für Versicherungen?“ — die KI antwortet aus deinen Dokumenten, mit Quellenangabe.

  • Kalender & Fristen

    Vertragslaufzeiten, Kündigungsfristen und Garantien werden automatisch in den eigenen Kalender geschrieben.

  • Kostenanalyse

    Automatische Auswertung der Ausgaben aus erkannten Rechnungen. Trends, Vergleiche, Empfehlungen — ohne Excel.

  • Volltextsuche & OCR

    VisionKit-OCR digitalisiert Belege und Scans. Die Suche findet einzelne Sätze in Sekunden — auch in 10.000 Dokumenten.

03 · Quantifizierter Nutzen

Was DocFlow konkret einspart.

Belastbare Kennzahlen aus realer Anwendung — nicht aus Marketing-Folien. Basis: durchschnittliche KMU mit 5 Mitarbeitern und 80 Dokumenten pro Monat.

0
weniger Suchzeit pro Dokument
von Ø 6 Min → < 30 Sek
0
eingesparte Std. pro Monat & Mitarbeiter
Belegablage, Suche, Frist-Tracking
0
Kostenersparnis pro Mitarbeiter & Jahr
bei 45 € durchschn. Stundensatz
0
Klassifikations-Treffgenauigkeit
gemessen an über 50.000 Dokumenten

Beispielrechnung — KMU mit 5 Mitarbeitern

Konservative Schätzung auf Basis realer Anwendungsdaten

Annahmen Mitarbeiter: 5 Zeitersparnis/Monat: 12 h Stundensatz: 45 € Zeitraum: 12 Monate
Zeitersparnis / Jahr
720Std.
Kostenersparnis / Jahr
32.400
Amortisation Lizenz
<2Monate
04 · Datenschutz

Datenschutz ist kein Zusatzfeature.

DocFlow wurde von Grund auf nach europäischen Standards entwickelt. Keine Black Box — der Nutzer behält jederzeit die volle Kontrolle.

EU-Hosting Frankfurt

Server, Datenbank und Embeddings laufen ausschließlich auf europäischer Infrastruktur (Supabase EU-West). Keine US-Übermittlung.

Daten beim Anwender

Originaldateien bleiben in der eigenen Cloud des Nutzers — Google Drive, Dropbox, OneDrive oder iCloud. DocFlow ist nie alleiniger Speicherort.

DSGVO-konform

Trennscharfe Consent-Checkboxen, AV-Vertrag mit Sub-Auftragsverarbeitern, Recht auf Löschung und Datenexport jederzeit per Klick.

Keine Werbe-Nutzung

Dokumente werden nie für Werbung, Tracking oder externes Modell-Training verwendet. Kein Profiling, kein Verkauf an Dritte.

Verschlüsselung

TLS 1.3 in der Übertragung, AES-256 at-rest. OAuth-Tokens für Cloud-Verbindungen verschlüsselt gespeichert und jederzeit widerrufbar.

Transparenz

Privacy-Manifest in der App, öffentlich einsehbare Datenschutzerklärung, klare Liste aller Sub-Auftragsverarbeiter (Google AI, Supabase, PayPal).

Privacy by Design & by Default · Art. 25 DSGVO · von der ersten Code-Zeile an mitgedacht

05 · EU AI Act

Regulatorische Einordnung nach EU AI Act.

Seit 2026 ist die EU-KI-Verordnung verbindlich. DocFlow wurde von Beginn an risiko-basiert klassifiziert und erfüllt die geforderten Transparenz- und Dokumentations-Pflichten.

Risikoklasse · begrenztes Risiko

DocFlow = „Limited Risk“ KI-System

DocFlow klassifiziert Dokumente und gibt Empfehlungen, trifft aber keine automatisierten Entscheidungen mit Rechtswirkung — weder für Kredit, Versicherung, Bewerbung noch Strafverfolgung. Damit fällt das System nach Art. 50 EU AI Act in die Kategorie Limited Risk.

Hauptpflicht in dieser Klasse: Transparenz. Anwender müssen wissen, dass sie mit einem KI-System interagieren — in DocFlow durch sichtbare Modell-Kennzeichnung, Quellenangaben im Chat und Hinweise bei Klassifikations-Vorschlägen umgesetzt.

Transparenz-Pflicht (Art. 50)

KI-generierte Antworten sind im Chat klar markiert. Modell, Datum, Quelle sichtbar.

Daten-Governance (Art. 10)

Klassifikations-Modelle nutzen ausschließlich nutzereigene Daten. Kein Training auf Kundendokumenten.

Technische Dokumentation (Art. 11)

Architektur, Modellwahl, Tests, Risiken — alles dokumentiert im internen Compliance-Wiki.

Menschliche Aufsicht (Art. 14)

Jede KI-Klassifikation ist vom Anwender korrigierbar. Lock-Flags verhindern Re-Überschreibung.

Minimal Risk
Spam-Filter, KI-Spiele — keine Pflichten
Limited Risk
Chatbots, Klassifikation — Transparenz-Pflicht
High Risk
Kredit-Scoring, Bewerbungsfilter — Konformitätsprüfung
Unacceptable Risk
Social Scoring — verboten in der EU
06 · AI Governance

Vertrauen entsteht durch Kontrolle.

Sechs Governance-Prinzipien, die in DocFlow nicht als Add-on, sondern als Architektur-Entscheidung umgesetzt sind.

G1

Human-in-the-Loop

Vier Kontrollebenen: (1) Confidence-Score bei jeder Klassifikation, < 0,7 triggert automatische Rückfrage statt stille Ablage. (2) Ein-Klick-Korrektur über Edit-Button in Dokument-Detailansicht. (3) Lock-Flag verhindert dauerhaft, dass die KI eine vom Nutzer korrigierte Klassifikation wieder überschreibt. (4) Bulk-Review-Modus zeigt alle automatischen Klassifikationen der letzten 7 Tage zur Schnellprüfung. Keine Entscheidung passiert ohne Sichtbarkeit für den Anwender.

G2

Erklärbarkeit

RAG-Architektur mit Quellenangabe — jede Chat-Antwort verlinkt auf das konkrete Dokument, aus dem die Information stammt. Keine Black-Box-Antworten.

G3

Datenhoheit

Originaldateien bleiben in der Nutzer-Cloud. DocFlow ist nie alleiniger Speicherort, jeder Zugriff revoke-bar über OAuth-Token-Widerruf in einem Klick.

G4

Lösch-Konzept

DSGVO-Recht auf Vergessenwerden technisch implementiert: ein Klick löscht Dokument, Embeddings (pgvector), Chat-Kontext und Audit-Einträge konsistent.

G5

Bias-Monitoring

Klassifikations-Genauigkeit pro Dokumenttyp kontinuierlich gemessen. Ausreißer triggern Modell-Review — verhindert systematische Fehlklassifikation.

G6

Audit-Trail

Jede Klassifikation, Korrektur und Löschung wird mit Zeitstempel protokolliert. Revisionssicher — GoBD-konform für 10 Jahre.

07 · Plattformen

Ein System. Jedes Gerät.

DocFlow läuft überall, wo der Anwender arbeitet — nativ, im Browser, auf dem Tablet. Daten und Einstellungen nahtlos synchron.

DocFlow auf allen Geräten

Überall verfügbar, immer synchron

Belege fotografieren am Smartphone, später am Desktop prüfen, im Tablet präsentieren — DocFlow folgt dem Nutzer durch den Tag.

  • iOS
    Native App mit VisionKit-OCR, FaceID, Apple-Kalender-Sync, Document-Scanner aus dem Sperrbildschirm.
  • Android
    Native App mit Material-You-Design, Google-Drive-Integration, Biometrie-Login.
  • Web / PWA
    Vollwertige Browser-Anwendung, installierbar als Progressive Web App auf Mac, Windows und Linux.
  • iPad
    Optimierte Tablet-Ansicht mit Split-View, Apple-Pencil-Annotationen, Multi-Column-Layout.
  • Desktop
    Drag-&-Drop-Upload, Massenimport ganzer Ordner, Tastatur-Shortcuts für Power-User.
08 · Architektur

Wie DocFlow technisch aufgebaut ist.

Fünf Schichten, klar getrennt. Moderner Stack, Cloud-native, ohne Vendor-Lock-in.

L1

Client

Was der Nutzer sieht — native Apps & Web

React Native (Expo) Next.js 14 PWA TypeScript VisionKit OCR
L2

API & Edge-Functions

Vermittlungs-Schicht — Routing, Auth, Streaming

Next.js Route Handlers PM2 auf VPS Supabase Edge Functions REST + SSE
L3

KI & Intelligence

Das Herz — Klassifikation, RAG, Tool-Use

Google Gemini 2.5 Flash Function Calling / Tool Use Vector Embeddings (pgvector) Klassifikation & OCR-Refinement
L4

Daten & Persistenz

EU-Hosting — nutzer-gehoster Cloud-Anschluss

Supabase Postgres (EU-Frankfurt) Row-Level Security pgvector HNSW Index User-Cloud: Drive / Dropbox / OneDrive / iCloud
L5

Infrastruktur & Betrieb

Build, Deploy, Monitoring — alles automatisiert

VPS Hostinger (Frankfurt) GitHub Actions CI/CD EAS Build (iOS / Android) PayPal-Subscriptions
09 · Strategische Analyse

Stärken, Chancen, Risiken.

Standortbestimmung für die strategische Weiterentwicklung — was DocFlow auszeichnet, welche Märkte sich öffnen und worauf zu achten ist.

S

Stärken

  • Plattformübergreifend aus einem Code-Stamm
  • EU-Hosting plus Cloud-bring-your-own als USP
  • Schlankes Team, schnelle Iteration, eigenes Know-how
  • Existierende Marketing-Site & B2B-Funnel
O

Chancen

  • E-Rechnung-Pflicht 2025 zwingt 3 Mio. KMU zur Digitalisierung
  • 13,7 % jährliches Wachstum im DMS-Segment EMEA
  • B2C-Expansion: Privathaushalte als Zweitmarkt
  • Steuerberater-Partnerschaften als Vertriebskanal
T

Risiken

  • EU-AI-Act bringt zusätzliche Compliance-Pflichten
  • Big-Tech-Player könnten DMS bundlen (Microsoft Copilot)
  • Preisdruck durch kostenlose OCR (Apple Notes, Google Lens)
  • Modell-Preise der KI-Provider können sich ändern
10 · Vision & Roadmap

Wohin sich DocFlow entwickelt.

Aus dem Dokumenten-Manager wird der persönliche „Chief of Staff“ für Alltag und Unternehmen.

2026 · Q1 · erledigt

MVP & Web-Launch

Erste Version mit OCR, Klassifikation und Cloud-Anbindung. Web-PWA und Marketing-Site live.

2026 · Q1 · erledigt

Native iOS- & Android-App

Vollwertige Apps mit VisionKit-Scan, Push-Notifications und Biometrie-Login. App-Store-Submission abgeschlossen.

2026 · Q2 · aktuell

Chat-Tool-Use & B2B-Solutions

Gemini-Function-Calling-Architektur, Business-Solutions-Page, erste B2B-Pilotkunden über docflow-business.de.

2026 · Q3 / Q4

E-Rechnung & DATEV-Schnittstelle

XRechnung-Export, ZUGFeRD-Parsing, DATEV-/Lexoffice-Anbindung — positioniert DocFlow als Vorstufe zur Buchhaltung.

2027

Multi-Tenant & Team-Workspaces

Geteilte Workspaces für Familien und KMU-Teams, Rollen-Konzept, Read-Only-Zugänge für Steuerberater.

2028 · Vision

Proaktiver Lebens-Assistent

DocFlow erinnert nicht nur an Fristen, sondern verhandelt selbständig bessere Tarife, schlägt Steueroptimierungen vor — KI als persönlicher Chief of Staff.

11 · FAQ & Prüferfragen

Häufige Fragen zu DocFlow.

Antworten auf typische Fragen zu Technologie, Sicherheit und Architektur — aufbereitet für technische Tiefen-Prüfung.

01 Warum Google Gemini 2.5 Flash statt anderer LLMs?
Drei Gründe: (1) EU-Hosting über Google Cloud Frankfurt ermöglicht DSGVO-konformen Betrieb ohne US-Transfer. (2) Native Tool-Use-Architektur — Function-Calling ist robuster als bei OpenAI-Modellen für unsere RAG-Pipeline. (3) Preis-Leistung bei deutschsprachigen Dokumenten: Gemini 2.5 Flash kostet ~70 % weniger als GPT-4o bei vergleichbarer Klassifikations-Genauigkeit. Vertragsgrundlage ist ein DPA mit Google Ireland Ltd., Sub-Auftragsverarbeitung dokumentiert.
02 Wie wird sichergestellt, dass sensible Dokumente nicht in falsche Hände geraten?
Fünf Sicherheitsebenen: (1) Row-Level Security in Postgres — jeder Datensatz ist an die User-ID gebunden, kein Cross-User-Zugriff möglich. (2) TLS 1.3 in der Übertragung, AES-256 at-rest. (3) OAuth-Token für Cloud-Verbindungen verschlüsselt gespeichert, jederzeit revoke-bar. (4) Biometrie-Login auf den Apps (FaceID, TouchID). (5) Audit-Trail jeder Datenzugriffe — manipulationssicher mit Zeitstempel.
03 Was passiert, wenn die KI ein wichtiges Dokument falsch klassifiziert?
DocFlow zeigt jede automatische Klassifikation mit Confidence-Score an. Niedrige Confidence < 0,7 triggert manuelle Rückfrage. Der Anwender kann jede Klassifikation per Klick korrigieren — die Korrektur wird mit einem Lock-Flag versehen, sodass die KI sie nicht erneut überschreibt. Zusätzlich wandert jede Korrektur in eine Trainings-Pipeline, die als Feedback-Signal die Genauigkeit kontinuierlich verbessert. Falsch klassifizierte Dokumente bleiben zudem im Volltextindex auffindbar — nichts geht verloren.
04 Wie skaliert das System bei 10.000 Dokumenten pro Nutzer?
Drei Skalierungs-Strategien: (1) pgvector HNSW-Index — sub-50ms Vektorsuche auch bei 100k+ Embeddings pro User. (2) Lazy-Loading & Pagination im Frontend, das Dashboard lädt nur sichtbare Dokumente. (3) Edge-Functions für OCR- und Klassifikations-Jobs — horizontal skalierbar über Supabase. Aktuelle Test-Workspaces mit 50.000+ Dokumenten antworten in < 200 ms. Bottleneck wäre primär das LLM-Rate-Limit, das pro Tenant separat eingestellt wird.
05 Welche Backup-Strategie gilt für die Vektordatenbank?
Dreistufiges Backup: (1) Continuous WAL-Archivierung via Supabase — Point-in-Time-Recovery bis zur Sekunde innerhalb 7 Tagen. (2) Tägliche Vollsicherung mit 30-Tage-Retention, verschlüsselt auf separaten EU-Storage. (3) Embeddings sind reproduzierbar — bei vollständigem Verlust können sie aus den Originaldokumenten in der User-Cloud regeneriert werden. Recovery-Zeit-Ziel (RTO): < 4 h, Recovery-Punkt-Ziel (RPO): < 15 min.
06 Wie funktioniert eine DSGVO-Löschung, wenn Embeddings bereits erstellt sind?
Das Lösch-Konzept ist Teil der Architektur: Dokument, Embeddings, Chat-Kontext und Audit-Einträge sind über Foreign-Keys mit ON-DELETE-CASCADE verknüpft. Ein Klick auf „Löschen“ entfernt alle Spuren transaktional. Embeddings sind nicht reversibel — aus dem Vektor kann das Originaldokument nicht rekonstruiert werden. Trotzdem werden sie konsequent mit-gelöscht, um auch theoretische Re-Identifikation auszuschließen. Nutzer können zusätzlich ihren kompletten Account inkl. aller Cloud-OAuth-Verbindungen in einer Aktion löschen.
07 Was passiert, wenn die Google-Gemini-API ausfällt?
Drei Resilience-Stufen: (1) Graceful Degradation — Volltextsuche, Cloud-Sync, Dashboards und alle bereits klassifizierten Dokumente funktionieren weiterhin. Nur Neu-Klassifikation und Chat sind betroffen. (2) Retry-Queue mit Exponential-Backoff — eingehende Dokumente landen in einer persistierten Queue und werden automatisch nachverarbeitet, sobald die API zurück ist. (3) Provider-Abstraktionsschicht — der LLM-Aufruf läuft über einen eigenen Adapter, ein Fallback auf Mistral oder Anthropic ist innerhalb 30 Minuten umschaltbar. Status wird transparent über ein Health-Banner in der App kommuniziert.
08 Wie wird sichergestellt, dass die KI-Klassifikation korrekt bleibt?
Fünf Qualitäts-Mechanismen: (1) Confidence-Score bei jeder Klassifikation — Werte < 0,7 triggern manuelle Rückfrage statt stille Ablage. (2) Continuous Monitoring der Trefferquote pro Dokumenttyp — Drift im Modellverhalten löst automatischen Review aus. (3) Feedback-Loop — jede Nutzer-Korrektur wird als Trainings-Signal gespeichert und in Few-Shot-Prompts berücksichtigt. (4) Goldener Testset mit 500 manuell kuratierten Dokumenten läuft bei jedem Modell-Update als Regression-Test. (5) Bias-Monitoring pro Dokumenttyp verhindert systematische Fehlklassifikation in Randfällen wie mehrsprachigen Dokumenten oder ungewöhnlichen Formaten.
12 · Fazit

Ein Produkt. Eine Vision. Ein Markt im Wandel.

DocFlow steht an der Schnittstelle aus KI-Revolution, regulatorischem Druck und realem Anwender-Bedürfnis. Hier entsteht nicht ein weiteres Tool, sondern ein digitaler Assistent, der sich an seinen Nutzer anpasst — nicht umgekehrt.