KI-Wissensdatenbank
Du fragst, das System antwortet. Mit Quelle.
Wir bauen Dir die RAG-Wissensdatenbank: Deine Firmen-Dokumente werden vektorisiert, in natürlicher Sprache abrufbar gemacht, mit Quellen-Verlinkung zum Original. Voraussetzung für E-Mail-Autopilot, KI-Bots und KI-Assistent.
Senior-Anwältin hat 22 Jahre BMF-Schreiben gesammelt. Junior-Anwalt fragt: „Wie war noch der Fall mit der Holding-Struktur 2018?". Senior klickt 15 Minuten in 4 SharePoint-Ordnern, findet drei mögliche Akten, schickt sie alle. Junior liest 90 Minuten, findet die richtige Stelle.
Mit der RAG-Wissensdatenbank fragt Junior direkt im Chat: „Holding-Struktur Steueroptimierung 2018, Akte mit Anrechnungs-Frage". Antwort kommt in 5 Sekunden, mit Link zum Original-Schriftsatz und der genauen Stelle. Senior-Wissen ist sofort verfügbar, Senior-Zeit bleibt frei für komplexe Fälle.
Bilder, die Dir vertraut vorkommen.
Du erkennst Dich in einem dieser Bilder wieder?
- 01
Firmenwissen liegt ungenutzt in Ordnern, 22 Jahre Akten in SharePoint, niemand außer der Senior-Anwältin findet sich darin zurecht
- 02
Mitarbeiter suchen 1 bis 2 Stunden täglich nach internen Informationen, bei 30 Wissensarbeitern und 60 € Vollkosten 800.000 € pro Jahr in reine Such-Zeit
- 03
Senior-Wissen geht beim Ausscheiden verloren, Dr. Berger geht in Pension, das Praxis-Wissen über 18 Jahre Patienten-Verläufe verschwindet mit ihm
- 04
Onboarding neuer MA dauert Monate, weil Junior-Anwalt erst lernen muss, wo welche Akte liegt und wer was wann entschieden hat
- 05
Senior-MA als Engpass für Standard-Fragen, Junior fragt 5-mal täglich, Senior verliert eine Stunde pro Tag in Suchen-und-Erklären-Mode
Der Prozess in 5 Schritten.
- 01
Discovery
Welche Datenquellen, Volumen, Sensibilität
- 02
Daten-Migration
OCR + Strukturierung
- 03
Vektor-DB-Setup
Sichere EU-DB, Embedding-Modelle
- 04
Chat-Interface
Custom-UI oder Bot-Integration
- 05
Update-Pipeline
Auto-Indexierung neuer Dokumente
Was Du am Ende in der Hand hast.
| Deliverable | Details |
|---|---|
| Daten-Migration | Word, Excel, PDF, Bilder → strukturiert |
| Vektorisierung | Embedding in sichere EU-Vektor-DB |
| Chat-Interface | Custom-UI oder Slack/Teams-Bot |
| Quellen-Verlinkung | Antwort + Link zum Original-Dokument |
| Update-Pipeline | Neue Dokumente automatisch indexiert |
Wert vor Preis.
Mitarbeiter suchen typisch 1 bis 2 Stunden pro Tag nach internen Informationen in SharePoint, GDrive und alten Mails. Bei 30 Wissensarbeitern und 60 € Vollkosten sind das 800.000 € pro Jahr in Such-Zeit. Eine RAG-Wissensbasis senkt die Such-Zeit auf Sekunden.
Realistische Hebel.
-
Hebel 01
Such-Zeit von Stunden auf Sekunden
Statt SharePoint-Ordner durchklicken: Frage stellen, Antwort plus Quelle bekommen.
-
Hebel 02
Senior-Wissen bleibt erhalten
Wenn Senior-MA gehen, bleibt das Wissen in der RAG-DB. Onboarding neuer MA wird drastisch beschleunigt.
-
Hebel 03
Voraussetzung für KI-Pipelines
E-Mail-Autopilot, Bots und Assistent brauchen RAG als Wissensbasis. Eine Investition, viele Folge-Use-Cases.
Was es NICHT ist.
Damit klar ist, wo die Linie verläuft.
-
Kein Ersatz für Daten-Bereinigung
RAG ist nur so gut wie die Daten-Basis. Bei chaotischen Quellen vorab Daten-Analyse.
-
Keine SaaS-Lizenz
Custom-Build mit EU-Vektor-DB (Qdrant, Weaviate). Kein Vendor-Lock-in.
-
Keine Garantie für 100-%-Antwort-Qualität
KI kann fehlinterpretieren. Quellen-Verlinkung erlaubt sofortige Verifikation, das ist Feature.
Eine kurze Liste.
- Daten-Quellen (SharePoint, GDrive, Confluence, alte Mails) als Migrations-Basis
- Daten-Analyse vorab empfohlen, wenn Daten-Qualität unklar ist
- RAG-Power-User pro Team für 0,5 Tag Schulung
- Discovery-Workshop für Use-Case-Priorisierung und DSGVO-Klassifikation
Auf Salzburger Handschlag.
| Aspekt | Status |
|---|---|
| EU-Hosting | ✓ Vektor-DB Qdrant oder Weaviate auf Hetzner Frankfurt |
| On-Premise-Option | ✓ für sensible Branchen (Anwalt, Arzt) Self-Hosting im Kunden-Rechenzentrum |
| Embedding-Modelle | ✓ EU-Modelle bevorzugt (Mistral, Cohere EU), sonst OpenAI mit AVV |
| Daten-Hoheit | ✓ Originale bleiben in Kunden-Quellen, RAG-DB ist Vektor-Index, kein Klartext-Cache |
Was schiefgehen kann, und wie wir damit umgehen.
| Risiko | Wie wir es lösen |
|---|---|
| Halluzinationen bei lückenhafter Wissensbasis | Konfidenz-Score pro Antwort, „weiß ich nicht"-Fallback statt Halluzination, Quellen-Pflicht-Check. |
| Sehr große Daten-Mengen (>1 TB) | Chunked-Indexierung in Phasen, Top-Quellen zuerst, Rest iterativ. |
| Berechtigungs-Komplexität (nicht jeder MA darf alles sehen) | Role-based-Access-Layer in der RAG-DB, pro User-Rolle gefilterte Antworten. |
So sieht das in Deiner Branche aus.
Klick auf Deine Branche für konkrete Beispiele aus unseren Projekten und dem Soizburg-AI-Kompass.
Hotellerie
Kanzleien
Handwerk
Ordinationen
Maklerbüros
Online-Shops
Industrie
Was als nächstes Sinn ergibt.
| Folge-Schritt | Wann sinnvoll | Modell |
|---|---|---|
| Automatisierung E-Mail | Wenn die RAG-Basis für Service-Mail-Autopilot genutzt werden soll | Custom-Build · 150 €/h netto |
| KI-Bots (Omnichannel) | Wenn die RAG-Basis für 24/7-Kunden-Bots genutzt werden soll | Custom-Build · 150 €/h netto |
| Daten-Analyse | Wenn vor RAG die Daten-Qualität geprüft werden soll | Festpreis 450 € netto |
FAQ.
Welche Datenquellen lassen sich für die RAG-Wissensbasis anbinden?
Wo werden die vektorisierten Daten gespeichert?
Was passiert, wenn die KI ein Dokument falsch interpretiert?
Wie lang dauert die RAG-Umsetzung typisch?
Wie groß muss die Wissensbasis sein, damit RAG sinnvoll funktioniert?
KI-Wissensdatenbank anfragen
Nach Aufwand · 150 €/h netto · individuelles Angebot nach Briefing
Termin direkt buchen
Wir nutzen Cal.com für die Terminvereinbarung. Mit dem Klick wird das Buchungs-Widget direkt hier geladen, dabei stellt Dein Browser eine Verbindung zu Cal.com her und Cal.com setzt Cookies. Mehr im Datenschutz.
Noch nicht ganz klar, ob das die richtige Lösung für Dich ist?
Soizburg-AI-Kompass starten