Zeit sparen · KI-Lösung

KI-Wissensdatenbank

Du fragst, das System antwortet. Mit Quelle.

Wir bauen Dir die RAG-Wissensdatenbank: Deine Firmen-Dokumente werden vektorisiert, in natürlicher Sprache abrufbar gemacht, mit Quellen-Verlinkung zum Original. Voraussetzung für E-Mail-Autopilot, KI-Bots und KI-Assistent.

Nach Aufwand · 150 €/h netto · individuelles Angebot nach Briefing

Kostenloses Erstgespräch

Geschrieben von Martin Arnsteiner, BA · Letzte Aktualisierung: 30.07.2026

Worum es geht

Senior-Anwältin hat 22 Jahre BMF-Schreiben gesammelt. Junior-Anwalt fragt: „Wie war noch der Fall mit der Holding-Struktur 2018?". Senior klickt 15 Minuten in 4 SharePoint-Ordnern, findet drei mögliche Akten, schickt sie alle. Junior liest 90 Minuten, findet die richtige Stelle.

Mit der RAG-Wissensdatenbank fragt Junior direkt im Chat: „Holding-Struktur Steueroptimierung 2018, Akte mit Anrechnungs-Frage". Antwort kommt in 5 Sekunden, mit Link zum Original-Schriftsatz und der genauen Stelle. Senior-Wissen ist sofort verfügbar, Senior-Zeit bleibt frei für komplexe Fälle.

Wer das braucht

Bilder, die Dir vertraut vorkommen.

Du erkennst Dich in einem dieser Bilder wieder?

01
Firmenwissen liegt ungenutzt in Ordnern, 22 Jahre Akten in SharePoint, niemand außer der Senior-Anwältin findet sich darin zurecht
02
Mitarbeiter suchen 1 bis 2 Stunden täglich nach internen Informationen, bei 30 Wissensarbeitern und 60 € Vollkosten 800.000 € pro Jahr in reine Such-Zeit
03
Senior-Wissen geht beim Ausscheiden verloren, Dr. Berger geht in Pension, das Praxis-Wissen über 18 Jahre Patienten-Verläufe verschwindet mit ihm
04
Onboarding neuer MA dauert Monate, weil Junior-Anwalt erst lernen muss, wo welche Akte liegt und wer was wann entschieden hat
05
Senior-MA als Engpass für Standard-Fragen, Junior fragt 5-mal täglich, Senior verliert eine Stunde pro Tag in Suchen-und-Erklären-Mode

So arbeiten wir

Der Prozess in 5 Schritten.

01

Discovery

Welche Datenquellen, Volumen, Sensibilität
02

Daten-Migration

OCR + Strukturierung
03

Vektor-DB-Setup

Sichere EU-DB, Embedding-Modelle
04

Chat-Interface

Custom-UI oder Bot-Integration
05

Update-Pipeline

Auto-Indexierung neuer Dokumente

Was Du bekommst

Was Du am Ende in der Hand hast.

Deliverable	Details
Daten-Migration	Word, Excel, PDF, Bilder → strukturiert
Vektorisierung	Embedding in sichere EU-Vektor-DB
Chat-Interface	Custom-UI oder Slack/Teams-Bot
Quellen-Verlinkung	Antwort + Link zum Original-Dokument
Update-Pipeline	Neue Dokumente automatisch indexiert

Was es kostet

Wert vor Preis.

Mitarbeiter suchen typisch 1 bis 2 Stunden pro Tag nach internen Informationen in SharePoint, GDrive und alten Mails. Bei 30 Wissensarbeitern und 60 € Vollkosten sind das 800.000 € pro Jahr in Such-Zeit. Eine RAG-Wissensbasis senkt die Such-Zeit auf Sekunden.

Stundensatz 150 €/h netto · individuelles Angebot nach Briefing

Was Du gewinnst

Realistische Hebel.

Hebel 01
Such-Zeit von Stunden auf Sekunden

Statt SharePoint-Ordner durchklicken: Frage stellen, Antwort plus Quelle bekommen.
Hebel 02
Senior-Wissen bleibt erhalten

Wenn Senior-MA gehen, bleibt das Wissen in der RAG-DB. Onboarding neuer MA wird drastisch beschleunigt.
Hebel 03
Voraussetzung für KI-Pipelines

E-Mail-Autopilot, Bots und Assistent brauchen RAG als Wissensbasis. Eine Investition, viele Folge-Use-Cases.

Klare Linien

Was es NICHT ist.

Damit klar ist, wo die Linie verläuft.

Kein Ersatz für Daten-Bereinigung

RAG ist nur so gut wie die Daten-Basis. Bei chaotischen Quellen vorab Daten-Analyse.
Keine SaaS-Lizenz

Custom-Build mit EU-Vektor-DB (Qdrant, Weaviate). Kein Vendor-Lock-in.
Keine Garantie für 100-%-Antwort-Qualität

KI kann fehlinterpretieren. Quellen-Verlinkung erlaubt sofortige Verifikation, das ist Feature.

Was Du vorbereitest

Eine kurze Liste.

Daten-Quellen (SharePoint, GDrive, Confluence, alte Mails) als Migrations-Basis
Daten-Analyse vorab empfohlen, wenn Daten-Qualität unklar ist
RAG-Power-User pro Team für 0,5 Tag Schulung
Discovery-Workshop für Use-Case-Priorisierung und DSGVO-Klassifikation

Sicherheit & DSGVO

Auf Salzburger Handschlag.

Aspekt	Status
EU-Hosting	✓ Vektor-DB Qdrant oder Weaviate auf Hetzner Frankfurt
On-Premise-Option	✓ für sensible Branchen (Anwalt, Arzt) Self-Hosting im Kunden-Rechenzentrum
Embedding-Modelle	✓ EU-Modelle bevorzugt (Mistral, Cohere EU), sonst OpenAI mit AVV
Daten-Hoheit	✓ Originale bleiben in Kunden-Quellen, RAG-DB ist Vektor-Index, kein Klartext-Cache

Risiken

Was schiefgehen kann, und wie wir damit umgehen.

Risiko	Wie wir es lösen
Halluzinationen bei lückenhafter Wissensbasis	Konfidenz-Score pro Antwort, „weiß ich nicht"-Fallback statt Halluzination, Quellen-Pflicht-Check.
Sehr große Daten-Mengen (>1 TB)	Chunked-Indexierung in Phasen, Top-Quellen zuerst, Rest iterativ.
Berechtigungs-Komplexität (nicht jeder MA darf alles sehen)	Role-based-Access-Layer in der RAG-DB, pro User-Rolle gefilterte Antworten.

Brancheneinblick

So sieht das in Deiner Branche aus.

Klick auf Deine Branche für konkrete Beispiele aus unseren Projekten und dem Soizburg-AI-Kompass.

Hotellerie

Standard-Operating-Procedures, Lieferanten-Verträge, Saison-Planung, alle Befund-Arzt-Listen für Pickup.

Kanzleien

Mandanten-Akten, BMF-Schreiben-Sammlung, Schriftsatz-Vorlagen, GwG-Onboarding-Material.

Handwerk

Hersteller-Datenblätter, Förder-Richtlinien (BAFA, KfW), Garantie-Bedingungen, Aufmaß-Standards.

Ordinationen

Behandlungs-Leitlinien, Aufklärungs-Material, GOÄ/EBM-Tabellen (HWG-konform).

Maklerbüros

Marktdaten-Archive, Energieausweis-Vorlagen, Notar-Korrespondenz-Templates.

Online-Shops

Produkt-Datenblätter, Lieferanten-Konditionen, Service-Tickets-Wissen.

Industrie

Engineering-Doku, Wartungs-Handbücher, Kunden-Spezifikations-Archive, PLM-Daten.

Branchen-Selbsttest im Kompass starten

Wie es weitergeht

Was als nächstes Sinn ergibt.

Folge-Schritt	Wann sinnvoll	Modell
Automatisierung E-Mail	Wenn die RAG-Basis für Service-Mail-Autopilot genutzt werden soll	Custom-Build · 150 €/h netto
KI-Bots (Omnichannel)	Wenn die RAG-Basis für 24/7-Kunden-Bots genutzt werden soll	Custom-Build · 150 €/h netto
Daten-Analyse	Wenn vor RAG die Daten-Qualität geprüft werden soll	Festpreis 450 € netto

Häufige Fragen

FAQ.

Welche Datenquellen lassen sich für die RAG-Wissensbasis anbinden?

Strukturiert: Word, Excel, PowerPoint, PDF (digital plus gescannt), CSV. Semi-strukturiert: SharePoint, Google Drive, Confluence, Notion, Obsidian-Vaults. Unstrukturiert: E-Mail-Archive (Outlook, Gmail), Slack-Threads, Service-Ticket-Systeme (Freshdesk, Zendesk). Branchen-Software wie DATEV-Belege, RA-MICRO-Akten, Mews-Buchungs-Daten über API. Audio und Video: Whisper-Transkription macht alles durchsuchbar.

Wo werden die vektorisierten Daten gespeichert?

Standard: Vektor-DB (Qdrant oder Weaviate) auf Hetzner Frankfurt, vollständig EU-gehostet. Für sensible Branchen (Kanzlei, Arzt, Bank) On-Premise-Setup im Kunden-Rechenzentrum mit self-hosted Vektor-DB. Originale bleiben in der Quelle (SharePoint, Drive, etc.), die RAG-DB ist nur ein Vektor-Index, kein Klartext-Cache. Bei Recht auf Vergessen: Quell-Dokument löschen, RAG-Index re-baut sich automatisch.

Was passiert, wenn die KI ein Dokument falsch interpretiert?

Drei Sicherheitsnetze: (1) Quellen-Verlinkung in jeder Antwort, User klickt auf den Original-Schriftsatz und prüft selbst. (2) Konfidenz-Score, unter 80 % gibt die KI „Ich bin mir nicht sicher, prüfe Quelle X" zurück statt zu halluzinieren. (3) Fehler-Markierung im Chat, „falsche Antwort"-Button schreibt den Fall in die Korrekturschleife, fließt ins RAG-Tuning, ähnliche Fragen werden bei nächstem Mal richtig beantwortet.

Wie lang dauert die RAG-Umsetzung typisch?

8 bis 16 Wochen, abhängig von Datenmenge und Komplexität. Discovery und Daten-Analyse in Woche 1 bis 2, OCR-Strukturierung historischer Bestände in Woche 3 bis 6, Vektor-DB-Setup und Embedding-Modell-Wahl in Woche 4 bis 8, Chat-Interface und Berechtigungs-Layer in Woche 8 bis 12, Update-Pipeline und Schulung in Woche 12 bis 16. Bei sehr großen Beständen (mehr als 100k Dokumente) entsprechend länger.

Wie groß muss die Wissensbasis sein, damit RAG sinnvoll funktioniert?

Untergrenze: ca. 50 bis 100 Dokumente, sonst lohnt sich die Infrastruktur nicht (klassische Suche reicht). Sweet-Spot: 500 bis 50.000 Dokumente, da spielt RAG seine volle Stärke aus. Obergrenze: technisch unbegrenzt, bei sehr großen Beständen (Millionen Dokumente) kommen Berechtigungs- und Performance-Themen rein, das ist dann ein eigenes Architektur-Projekt.

Passt auch dazu