Zum Hauptinhalt springen
Kostenloses Erstgespräch
Klarheit gewinnen · KI-Lösung

Daten-Analyse

Liegen Deine Daten KI-bereit, oder sind sie das größte Hindernis?

Wir prüfen in 7 Werktagen jede Daten-Quelle in Deinem Betrieb auf Vollständigkeit, Konsistenz, Aktualität und Strukturierungsgrad, und sagen Dir, welche Quellen heute KI-tauglich sind, welche mit kleinem Aufwand, und welche grundsätzlich nicht.

450 € netto Fixpreis
Geschrieben von Martin Arnsteiner, BA · Letzte Aktualisierung:
Worum es geht

90 % aller KI-Projekte im Mittelstand scheitern nicht an der KI. Sie scheitern an den Daten. Stammdaten in DATEV, Stammdaten im CRM, Stammdaten in Excel, Stammdaten im SharePoint, alle leicht unterschiedlich, niemand weiß welche Quelle die Wahrheit ist.

Die Daten-Analyse macht aus dem Datenchaos ein klares Bild: was ist da, was ist sauber, was ist brauchbar für RAG, was muss erst aufgeräumt werden. Erst dann kann KI seriös eingesetzt werden, vorher ist es Marketing-Theater.

Wer das braucht

Bilder, die Dir vertraut vorkommen.

Du erkennst Dich in einem dieser Bilder wieder?

  • 01

    Firmenwissen liegt verstreut: SharePoint, GDrive, Excel, alte E-Mails, niemand weiß wo die aktuelle Version ist

  • 02

    KI-Projekte scheitern an Datenqualität, nicht an der KI selbst, aber niemand benennt es so

  • 03

    DSGVO-Risiko durch unklare Datenablage, Personenbezogene Daten in Excel-Listen ohne AVV

  • 04

    RAG-Versuche bleiben mittelmäßig, weil die Wissens-Quellen widersprüchlich sind

  • 05

    Stammdaten in 5 Systemen, keine Master-Quelle, jeder Bericht zeigt andere Zahlen

So arbeiten wir

Der Prozess in 5 Schritten.

  1. 01

    Discovery-Briefing

    60-Min-Call: Hauptsysteme, Datenarten, geplante KI-Use-Cases, bekannte Schmerzpunkte.

  2. 02

    Daten-Inventar

    Volumen, Format, Owner, Aktualisierungs-Frequenz pro Quelle erfassen.

  3. 03

    Qualitäts-Stichprobe

    Vollständigkeit, Konsistenz, Aktualität anhand 100 bis 200 Stichproben pro Hauptquelle.

  4. 04

    KI-Tauglichkeits-Score

    Pro Quelle: bereit für RAG, mit Aufwand bereit, oder nicht KI-tauglich. Mit Begründung.

  5. 05

    Bereinigungs-Plan und Master-Quelle

    Top-5-Quellen mit Aufräum-Plan, plus Empfehlung zur Single-Source-of-Truth-Definition.

Was Du bekommst

Was Du am Ende in der Hand hast.

Deliverable Details
Daten-Inventar Alle Quellen mit Volumen, Format, Owner, Aktualisierungs-Frequenz, Verfügbarkeit über API.
Qualitäts-Bericht 12-15 Seiten Pro Quelle: Stärken, Schwächen, Vollständigkeits-Quote, Konsistenz mit anderen Quellen, KI-Tauglichkeit.
KI-Readiness-Score Pro Quelle eine Skala 0 bis 100 Punkten, mit Begründung pro Achse (Strukturierung, Vollständigkeit, Aktualität, Zugriff).
Bereinigungs-Plan Top-5 Quellen mit Aufwand-Schätzung für KI-Tauglichkeit (Stunden, Tools, Verantwortlichkeit).
Master-Quelle-Empfehlung Welche Quelle als „Single Source of Truth" definiert werden sollte, mit Migrations-Skizze.
60-Min-Erläuterungs-Call Walk-through mit Geschäftsführung, Roadmap-Diskussion.
Was es kostet

Wert vor Preis.

Ein einziges KI-Projekt, das ohne Daten-Audit gestartet wird, verbrennt typisch 30.000 bis 80.000 € Custom-Build-Budget, bevor klar wird, dass die Daten nicht reichen. Die Daten-Analyse für 450 € verhindert genau das, sie ist das billigste Risiko-Management-Tool für KI-Projekte.

Fixpreis 450 € netto · Fixpreis · 7 Werktage
Was Du gewinnst

Realistische Hebel.

  • Hebel 01

    Single-Source-of-Truth definieren

    Klärung welcher CRM-Eintrag der Master ist, welcher Sheet-Stand, welche DATEV-Kunden-Nr. Schluss mit widersprüchlichen Berichten.

  • Hebel 02

    Datenbereinigung priorisieren

    Statt alles auf einmal aufräumen, nur die 3 Quellen, die für den ersten KI-Use-Case wirklich nötig sind. Aufwand 20 statt 200 Stunden.

  • Hebel 03

    KI-Projekt-Risiko reduzieren

    Vor dem Custom-Build-Vertrag wissen, ob die Daten reichen. Verhindert teure Spät-Erkenntnisse („funktioniert nicht weil Daten unvollständig").

Klare Linien

Was es NICHT ist.

Damit klar ist, wo die Linie verläuft.

  • Keine Datenbereinigung im Audit-Preis

    Wir liefern den Plan, das Aufräumen läuft separat (Custom-Build oder intern).

  • Keine ETL-Pipeline-Implementierung

    Wenn aus dem Audit ein Datenwarehouse-Projekt wird, ist das ein eigener Auftrag.

  • Keine Schreibrechte

    Wir arbeiten ausschließlich Read-Only. Keine versehentlichen Modifikationen Deiner Quell-Systeme.

  • Keine vollständige juristische DSGVO-Prüfung

    Wir flaggen DSGVO-Risiken, die juristische Detail-Prüfung trifft Dein Datenschutz-Beauftragter.

Was Du vorbereitest

Eine kurze Liste.

  • Liste der Hauptsysteme mit Datenmengen (CRM, ERP, Branchen-Software, Cloud-Speicher, Sheets, E-Mail-Archive)
  • Read-Only-Zugang zu den Hauptquellen für Stichproben
  • Top-3-KI-Use-Cases, für die die Daten gebraucht werden, als Bewertungs-Maßstab
  • 30 Min Geschäftsführer-Zeit plus 30 Min IT- oder Daten-Verantwortlicher plus 30 Min Datenschutz-Beauftragter
Sicherheit & DSGVO

Auf Salzburger Handschlag.

Aspekt Status
EU-Hosting der Soizburg-Tools ✓ Hetzner Frankfurt für Verarbeitung
Daten-Zugriff ✓ Read-Only auf Stammdaten und Stichproben, keine Schreibrechte
AVV nach DSGVO Art. 28 ✓ Soizburg AI als Auftragsverarbeiter, AVV im Onboarding, optional NDA
Personen-Daten in Stichproben ✓ Pseudonymisiert oder anonymisiert vor Verarbeitung in Soizburg-Tools
Daten-Löschung ✓ 90 Tage nach Audit-Abschluss alle Stichproben in Soizburg-Systemen gelöscht
Risiken

Was schiefgehen kann, und wie wir damit umgehen.

Risiko Wie wir es lösen
Sehr große Daten-Mengen (>10 Mio Datensätze pro Quelle) Stratifizierte Stichproben statt Vollscan. Mehraufwand bleibt bei Soizburg.
Keine API-Verfügbarkeit auf Hauptquelle Manuelle Exporte vom Kunden ergänzen, im Bericht klar markiert.
DSGVO-kritische Daten (Gesundheits-, Bonitäts-Daten) Nur aggregierte Stichproben, keine Einzeldaten in Soizburg-Tools, NDA-Pflicht im Onboarding.
Bereinigungs-Aufwand wird nicht umgesetzt Das Audit bleibt valide. Du kannst auch in 6 Monaten umsetzen, mit oder ohne uns.
Brancheneinblick

So sieht das in Deiner Branche aus.

Klick auf Deine Branche für konkrete Beispiele aus unseren Projekten und dem Soizburg-AI-Kompass.

Hotellerie
Mews/Apaleo PMS-Stammdaten, OTA-Sync-Konsistenz, Gäste-Profile in CRM, Pre-Stay-Mail-Daten, Bewertungs-Daten in DocFinder.
Kanzleien
DATEV-Mandanten-Stammdaten, RA-MICRO-Akten, Schriftsatz-Archive, BMF-Schreiben-Sammlung, Mandanten-Korrespondenz in Outlook.
Handwerk
pds- oder kwp-Branchensoftware-Stammdaten, Aufmaß-PDFs, Foto-Doku-Archive, Material-Bestellungen, Garantie-Akten.
Ordinationen
PVS-Stammdaten (Tomedo, T2med), Befund-PDFs, Patienten-Akten, IGeL-Aufklärung, Termin-Historie.
Maklerbüros
onOffice/FlowFact-Objekt-Stammdaten, Exposé-Vorlagen, Marktdaten-Archive, Bewertungs-Reports, Notar-Korrespondenz.
Online-Shops
Produkt-Katalog-Daten, Bestand-Sync zwischen Shop und ERP, Bewertungs-Texte, Kunden-Service-Mails.
Industrie
SAP-Stammdaten, MES-Logs, Wartungsprotokolle, Kunden-Service-Tickets, Engineering-Doku in PLM.
Wie es weitergeht

Was als nächstes Sinn ergibt.

Folge-Schritt Wann sinnvoll Modell
KI-Wissensdatenbank (RAG) Wenn aufgeräumte Daten in einer durchsuchbaren Wissensbasis verfügbar sein sollen Custom-Build · 150 €/h netto
Datenbereinigungs-Umsetzung Wenn der Bereinigungs-Plan umgesetzt werden soll Custom-Build · 150 €/h netto
Automatisierung Dokumente Wenn unstrukturierte Dokumente OCR-strukturiert werden sollen Custom-Build · 150 €/h netto
KI-Analyse Wenn die Daten-Basis steht und KI-Use-Cases priorisiert werden sollen Festpreis 450 € netto
Häufige Fragen

FAQ.

Was ist KI-Tauglichkeit von Daten?
Daten müssen vier Achsen erfüllen: Strukturierung (Schema klar?), Vollständigkeit (>80 % Felder befüllt?), Konsistenz (gleicher Eintrag in allen Quellen?), Aktualität (nicht älter als Use-Case erlaubt). Wenn eine Achse fehlt, scheitert RAG.
Was, wenn Daten DSGVO-kritisch sind?
Dann arbeiten wir nur mit anonymisierten oder pseudonymisierten Stichproben. Bei Folgeprojekten ist On-Premise EU-Hosting Pflicht, das klären wir transparent im Discovery.
Wie viele Datenquellen kann das Audit prüfen?
Standard bis 10 Hauptquellen. Mehr Quellen klären wir im Discovery, ggf. Premium-Variante. Pro Quelle Stichproben-basierte Bewertung, kein Vollscan außer auf Wunsch.
Was ist der Unterschied zur Technologie-Analyse?
Technologie-Analyse fragt: „Welche Tools nutzt Du?" Daten-Analyse fragt: „Wie sauber sind die Daten in diesen Tools?" Daten-Analyse ist tiefer, fokussierter auf Datenqualität als auf Tool-Auswahl.
Lohnt sich das auch ohne aktuelles KI-Projekt?
Ja, wenn Berichts-Widersprüche, DSGVO-Unsicherheiten oder geplante Tool-Migration im Raum stehen. Datenqualität ist sowieso der Marge-Hebel, KI ist nur ein Anlass.
Was bedeutet „Single Source of Truth"?
Eine Quelle, die als Master für eine Daten-Domäne definiert ist. Beispiel: Kunden-Stammdaten leben im Twenty-CRM, alle anderen Systeme synchronisieren von dort. Klärt Berichts-Widersprüche und Daten-Drift.
Wer schreibt den Bericht?
KI hilft bei Datenstruktur-Bewertung und Stichproben-Auswertung, ein Senior-Mensch (Martin Arnsteiner) prüft jede Empfehlung gegen Branchen-Erfahrung und DSGVO-Anforderungen.
Bereit?

Daten-Analyse buchen

450 € netto · 7 Werktage · Inventar plus Qualitäts-Score plus Bereinigungs-Plan

Termin direkt buchen

Wir nutzen Cal.com für die Terminvereinbarung. Mit dem Klick wird das Buchungs-Widget direkt hier geladen, dabei stellt Dein Browser eine Verbindung zu Cal.com her und Cal.com setzt Cookies. Mehr im Datenschutz.

Noch nicht ganz klar, ob das die richtige Lösung für Dich ist?

Soizburg-AI-Kompass starten