Zum Hauptinhalt springen
Kostenloses Erstgespräch
Zeit sparen · KI-Lösung

KI-Wissensdatenbank

Du fragst, das System antwortet. Mit Quelle.

Wir bauen Dir die RAG-Wissensdatenbank: Deine Firmen-Dokumente werden vektorisiert, in natürlicher Sprache abrufbar gemacht, mit Quellen-Verlinkung zum Original. Voraussetzung für E-Mail-Autopilot, KI-Bots und KI-Assistent.

Nach Aufwand · 150 €/h netto · individuelles Angebot nach Briefing
Geschrieben von Martin Arnsteiner, BA · Letzte Aktualisierung:
Worum es geht

Senior-Anwältin hat 22 Jahre BMF-Schreiben gesammelt. Junior-Anwalt fragt: „Wie war noch der Fall mit der Holding-Struktur 2018?". Senior klickt 15 Minuten in 4 SharePoint-Ordnern, findet drei mögliche Akten, schickt sie alle. Junior liest 90 Minuten, findet die richtige Stelle.

Mit der RAG-Wissensdatenbank fragt Junior direkt im Chat: „Holding-Struktur Steueroptimierung 2018, Akte mit Anrechnungs-Frage". Antwort kommt in 5 Sekunden, mit Link zum Original-Schriftsatz und der genauen Stelle. Senior-Wissen ist sofort verfügbar, Senior-Zeit bleibt frei für komplexe Fälle.

Wer das braucht

Bilder, die Dir vertraut vorkommen.

Du erkennst Dich in einem dieser Bilder wieder?

  • 01

    Firmenwissen liegt ungenutzt in Ordnern, 22 Jahre Akten in SharePoint, niemand außer der Senior-Anwältin findet sich darin zurecht

  • 02

    Mitarbeiter suchen 1 bis 2 Stunden täglich nach internen Informationen, bei 30 Wissensarbeitern und 60 € Vollkosten 800.000 € pro Jahr in reine Such-Zeit

  • 03

    Senior-Wissen geht beim Ausscheiden verloren, Dr. Berger geht in Pension, das Praxis-Wissen über 18 Jahre Patienten-Verläufe verschwindet mit ihm

  • 04

    Onboarding neuer MA dauert Monate, weil Junior-Anwalt erst lernen muss, wo welche Akte liegt und wer was wann entschieden hat

  • 05

    Senior-MA als Engpass für Standard-Fragen, Junior fragt 5-mal täglich, Senior verliert eine Stunde pro Tag in Suchen-und-Erklären-Mode

So arbeiten wir

Der Prozess in 5 Schritten.

  1. 01

    Discovery

    Welche Datenquellen, Volumen, Sensibilität

  2. 02

    Daten-Migration

    OCR + Strukturierung

  3. 03

    Vektor-DB-Setup

    Sichere EU-DB, Embedding-Modelle

  4. 04

    Chat-Interface

    Custom-UI oder Bot-Integration

  5. 05

    Update-Pipeline

    Auto-Indexierung neuer Dokumente

Was Du bekommst

Was Du am Ende in der Hand hast.

Deliverable Details
Daten-Migration Word, Excel, PDF, Bilder → strukturiert
Vektorisierung Embedding in sichere EU-Vektor-DB
Chat-Interface Custom-UI oder Slack/Teams-Bot
Quellen-Verlinkung Antwort + Link zum Original-Dokument
Update-Pipeline Neue Dokumente automatisch indexiert
Was es kostet

Wert vor Preis.

Mitarbeiter suchen typisch 1 bis 2 Stunden pro Tag nach internen Informationen in SharePoint, GDrive und alten Mails. Bei 30 Wissensarbeitern und 60 € Vollkosten sind das 800.000 € pro Jahr in Such-Zeit. Eine RAG-Wissensbasis senkt die Such-Zeit auf Sekunden.

Stundensatz 150 €/h netto · individuelles Angebot nach Briefing
Was Du gewinnst

Realistische Hebel.

  • Hebel 01

    Such-Zeit von Stunden auf Sekunden

    Statt SharePoint-Ordner durchklicken: Frage stellen, Antwort plus Quelle bekommen.

  • Hebel 02

    Senior-Wissen bleibt erhalten

    Wenn Senior-MA gehen, bleibt das Wissen in der RAG-DB. Onboarding neuer MA wird drastisch beschleunigt.

  • Hebel 03

    Voraussetzung für KI-Pipelines

    E-Mail-Autopilot, Bots und Assistent brauchen RAG als Wissensbasis. Eine Investition, viele Folge-Use-Cases.

Klare Linien

Was es NICHT ist.

Damit klar ist, wo die Linie verläuft.

  • Kein Ersatz für Daten-Bereinigung

    RAG ist nur so gut wie die Daten-Basis. Bei chaotischen Quellen vorab Daten-Analyse.

  • Keine SaaS-Lizenz

    Custom-Build mit EU-Vektor-DB (Qdrant, Weaviate). Kein Vendor-Lock-in.

  • Keine Garantie für 100-%-Antwort-Qualität

    KI kann fehlinterpretieren. Quellen-Verlinkung erlaubt sofortige Verifikation, das ist Feature.

Was Du vorbereitest

Eine kurze Liste.

  • Daten-Quellen (SharePoint, GDrive, Confluence, alte Mails) als Migrations-Basis
  • Daten-Analyse vorab empfohlen, wenn Daten-Qualität unklar ist
  • RAG-Power-User pro Team für 0,5 Tag Schulung
  • Discovery-Workshop für Use-Case-Priorisierung und DSGVO-Klassifikation
Sicherheit & DSGVO

Auf Salzburger Handschlag.

Aspekt Status
EU-Hosting ✓ Vektor-DB Qdrant oder Weaviate auf Hetzner Frankfurt
On-Premise-Option ✓ für sensible Branchen (Anwalt, Arzt) Self-Hosting im Kunden-Rechenzentrum
Embedding-Modelle ✓ EU-Modelle bevorzugt (Mistral, Cohere EU), sonst OpenAI mit AVV
Daten-Hoheit ✓ Originale bleiben in Kunden-Quellen, RAG-DB ist Vektor-Index, kein Klartext-Cache
Risiken

Was schiefgehen kann, und wie wir damit umgehen.

Risiko Wie wir es lösen
Halluzinationen bei lückenhafter Wissensbasis Konfidenz-Score pro Antwort, „weiß ich nicht"-Fallback statt Halluzination, Quellen-Pflicht-Check.
Sehr große Daten-Mengen (>1 TB) Chunked-Indexierung in Phasen, Top-Quellen zuerst, Rest iterativ.
Berechtigungs-Komplexität (nicht jeder MA darf alles sehen) Role-based-Access-Layer in der RAG-DB, pro User-Rolle gefilterte Antworten.
Brancheneinblick

So sieht das in Deiner Branche aus.

Klick auf Deine Branche für konkrete Beispiele aus unseren Projekten und dem Soizburg-AI-Kompass.

Hotellerie
Standard-Operating-Procedures, Lieferanten-Verträge, Saison-Planung, alle Befund-Arzt-Listen für Pickup.
Kanzleien
Mandanten-Akten, BMF-Schreiben-Sammlung, Schriftsatz-Vorlagen, GwG-Onboarding-Material.
Handwerk
Hersteller-Datenblätter, Förder-Richtlinien (BAFA, KfW), Garantie-Bedingungen, Aufmaß-Standards.
Ordinationen
Behandlungs-Leitlinien, Aufklärungs-Material, GOÄ/EBM-Tabellen (HWG-konform).
Maklerbüros
Marktdaten-Archive, Energieausweis-Vorlagen, Notar-Korrespondenz-Templates.
Online-Shops
Produkt-Datenblätter, Lieferanten-Konditionen, Service-Tickets-Wissen.
Industrie
Engineering-Doku, Wartungs-Handbücher, Kunden-Spezifikations-Archive, PLM-Daten.
Wie es weitergeht

Was als nächstes Sinn ergibt.

Folge-Schritt Wann sinnvoll Modell
Automatisierung E-Mail Wenn die RAG-Basis für Service-Mail-Autopilot genutzt werden soll Custom-Build · 150 €/h netto
KI-Bots (Omnichannel) Wenn die RAG-Basis für 24/7-Kunden-Bots genutzt werden soll Custom-Build · 150 €/h netto
Daten-Analyse Wenn vor RAG die Daten-Qualität geprüft werden soll Festpreis 450 € netto
Häufige Fragen

FAQ.

Welche Datenquellen lassen sich für die RAG-Wissensbasis anbinden?
Strukturiert: Word, Excel, PowerPoint, PDF (digital plus gescannt), CSV. Semi-strukturiert: SharePoint, Google Drive, Confluence, Notion, Obsidian-Vaults. Unstrukturiert: E-Mail-Archive (Outlook, Gmail), Slack-Threads, Service-Ticket-Systeme (Freshdesk, Zendesk). Branchen-Software wie DATEV-Belege, RA-MICRO-Akten, Mews-Buchungs-Daten über API. Audio und Video: Whisper-Transkription macht alles durchsuchbar.
Wo werden die vektorisierten Daten gespeichert?
Standard: Vektor-DB (Qdrant oder Weaviate) auf Hetzner Frankfurt, vollständig EU-gehostet. Für sensible Branchen (Kanzlei, Arzt, Bank) On-Premise-Setup im Kunden-Rechenzentrum mit self-hosted Vektor-DB. Originale bleiben in der Quelle (SharePoint, Drive, etc.), die RAG-DB ist nur ein Vektor-Index, kein Klartext-Cache. Bei Recht auf Vergessen: Quell-Dokument löschen, RAG-Index re-baut sich automatisch.
Was passiert, wenn die KI ein Dokument falsch interpretiert?
Drei Sicherheitsnetze: (1) Quellen-Verlinkung in jeder Antwort, User klickt auf den Original-Schriftsatz und prüft selbst. (2) Konfidenz-Score, unter 80 % gibt die KI „Ich bin mir nicht sicher, prüfe Quelle X" zurück statt zu halluzinieren. (3) Fehler-Markierung im Chat, „falsche Antwort"-Button schreibt den Fall in die Korrekturschleife, fließt ins RAG-Tuning, ähnliche Fragen werden bei nächstem Mal richtig beantwortet.
Wie lang dauert die RAG-Umsetzung typisch?
8 bis 16 Wochen, abhängig von Datenmenge und Komplexität. Discovery und Daten-Analyse in Woche 1 bis 2, OCR-Strukturierung historischer Bestände in Woche 3 bis 6, Vektor-DB-Setup und Embedding-Modell-Wahl in Woche 4 bis 8, Chat-Interface und Berechtigungs-Layer in Woche 8 bis 12, Update-Pipeline und Schulung in Woche 12 bis 16. Bei sehr großen Beständen (mehr als 100k Dokumente) entsprechend länger.
Wie groß muss die Wissensbasis sein, damit RAG sinnvoll funktioniert?
Untergrenze: ca. 50 bis 100 Dokumente, sonst lohnt sich die Infrastruktur nicht (klassische Suche reicht). Sweet-Spot: 500 bis 50.000 Dokumente, da spielt RAG seine volle Stärke aus. Obergrenze: technisch unbegrenzt, bei sehr großen Beständen (Millionen Dokumente) kommen Berechtigungs- und Performance-Themen rein, das ist dann ein eigenes Architektur-Projekt.
Bereit?

KI-Wissensdatenbank anfragen

Nach Aufwand · 150 €/h netto · individuelles Angebot nach Briefing

Termin direkt buchen

Wir nutzen Cal.com für die Terminvereinbarung. Mit dem Klick wird das Buchungs-Widget direkt hier geladen, dabei stellt Dein Browser eine Verbindung zu Cal.com her und Cal.com setzt Cookies. Mehr im Datenschutz.

Noch nicht ganz klar, ob das die richtige Lösung für Dich ist?

Soizburg-AI-Kompass starten