Daten-Analyse
Liegen Deine Daten KI-bereit, oder sind sie das größte Hindernis?
Wir prüfen in 7 Werktagen jede Daten-Quelle in Deinem Betrieb auf Vollständigkeit, Konsistenz, Aktualität und Strukturierungsgrad, und sagen Dir, welche Quellen heute KI-tauglich sind, welche mit kleinem Aufwand, und welche grundsätzlich nicht.
90 % aller KI-Projekte im Mittelstand scheitern nicht an der KI. Sie scheitern an den Daten. Stammdaten in DATEV, Stammdaten im CRM, Stammdaten in Excel, Stammdaten im SharePoint, alle leicht unterschiedlich, niemand weiß welche Quelle die Wahrheit ist.
Die Daten-Analyse macht aus dem Datenchaos ein klares Bild: was ist da, was ist sauber, was ist brauchbar für RAG, was muss erst aufgeräumt werden. Erst dann kann KI seriös eingesetzt werden, vorher ist es Marketing-Theater.
Bilder, die Dir vertraut vorkommen.
Du erkennst Dich in einem dieser Bilder wieder?
- 01
Firmenwissen liegt verstreut: SharePoint, GDrive, Excel, alte E-Mails, niemand weiß wo die aktuelle Version ist
- 02
KI-Projekte scheitern an Datenqualität, nicht an der KI selbst, aber niemand benennt es so
- 03
DSGVO-Risiko durch unklare Datenablage, Personenbezogene Daten in Excel-Listen ohne AVV
- 04
RAG-Versuche bleiben mittelmäßig, weil die Wissens-Quellen widersprüchlich sind
- 05
Stammdaten in 5 Systemen, keine Master-Quelle, jeder Bericht zeigt andere Zahlen
Der Prozess in 5 Schritten.
- 01
Discovery-Briefing
60-Min-Call: Hauptsysteme, Datenarten, geplante KI-Use-Cases, bekannte Schmerzpunkte.
- 02
Daten-Inventar
Volumen, Format, Owner, Aktualisierungs-Frequenz pro Quelle erfassen.
- 03
Qualitäts-Stichprobe
Vollständigkeit, Konsistenz, Aktualität anhand 100 bis 200 Stichproben pro Hauptquelle.
- 04
KI-Tauglichkeits-Score
Pro Quelle: bereit für RAG, mit Aufwand bereit, oder nicht KI-tauglich. Mit Begründung.
- 05
Bereinigungs-Plan und Master-Quelle
Top-5-Quellen mit Aufräum-Plan, plus Empfehlung zur Single-Source-of-Truth-Definition.
Was Du am Ende in der Hand hast.
| Deliverable | Details |
|---|---|
| Daten-Inventar | Alle Quellen mit Volumen, Format, Owner, Aktualisierungs-Frequenz, Verfügbarkeit über API. |
| Qualitäts-Bericht 12-15 Seiten | Pro Quelle: Stärken, Schwächen, Vollständigkeits-Quote, Konsistenz mit anderen Quellen, KI-Tauglichkeit. |
| KI-Readiness-Score | Pro Quelle eine Skala 0 bis 100 Punkten, mit Begründung pro Achse (Strukturierung, Vollständigkeit, Aktualität, Zugriff). |
| Bereinigungs-Plan | Top-5 Quellen mit Aufwand-Schätzung für KI-Tauglichkeit (Stunden, Tools, Verantwortlichkeit). |
| Master-Quelle-Empfehlung | Welche Quelle als „Single Source of Truth" definiert werden sollte, mit Migrations-Skizze. |
| 60-Min-Erläuterungs-Call | Walk-through mit Geschäftsführung, Roadmap-Diskussion. |
Wert vor Preis.
Ein einziges KI-Projekt, das ohne Daten-Audit gestartet wird, verbrennt typisch 30.000 bis 80.000 € Custom-Build-Budget, bevor klar wird, dass die Daten nicht reichen. Die Daten-Analyse für 450 € verhindert genau das, sie ist das billigste Risiko-Management-Tool für KI-Projekte.
Realistische Hebel.
-
Hebel 01
Single-Source-of-Truth definieren
Klärung welcher CRM-Eintrag der Master ist, welcher Sheet-Stand, welche DATEV-Kunden-Nr. Schluss mit widersprüchlichen Berichten.
-
Hebel 02
Datenbereinigung priorisieren
Statt alles auf einmal aufräumen, nur die 3 Quellen, die für den ersten KI-Use-Case wirklich nötig sind. Aufwand 20 statt 200 Stunden.
-
Hebel 03
KI-Projekt-Risiko reduzieren
Vor dem Custom-Build-Vertrag wissen, ob die Daten reichen. Verhindert teure Spät-Erkenntnisse („funktioniert nicht weil Daten unvollständig").
Was es NICHT ist.
Damit klar ist, wo die Linie verläuft.
-
Keine Datenbereinigung im Audit-Preis
Wir liefern den Plan, das Aufräumen läuft separat (Custom-Build oder intern).
-
Keine ETL-Pipeline-Implementierung
Wenn aus dem Audit ein Datenwarehouse-Projekt wird, ist das ein eigener Auftrag.
-
Keine Schreibrechte
Wir arbeiten ausschließlich Read-Only. Keine versehentlichen Modifikationen Deiner Quell-Systeme.
-
Keine vollständige juristische DSGVO-Prüfung
Wir flaggen DSGVO-Risiken, die juristische Detail-Prüfung trifft Dein Datenschutz-Beauftragter.
Eine kurze Liste.
- Liste der Hauptsysteme mit Datenmengen (CRM, ERP, Branchen-Software, Cloud-Speicher, Sheets, E-Mail-Archive)
- Read-Only-Zugang zu den Hauptquellen für Stichproben
- Top-3-KI-Use-Cases, für die die Daten gebraucht werden, als Bewertungs-Maßstab
- 30 Min Geschäftsführer-Zeit plus 30 Min IT- oder Daten-Verantwortlicher plus 30 Min Datenschutz-Beauftragter
Auf Salzburger Handschlag.
| Aspekt | Status |
|---|---|
| EU-Hosting der Soizburg-Tools | ✓ Hetzner Frankfurt für Verarbeitung |
| Daten-Zugriff | ✓ Read-Only auf Stammdaten und Stichproben, keine Schreibrechte |
| AVV nach DSGVO Art. 28 | ✓ Soizburg AI als Auftragsverarbeiter, AVV im Onboarding, optional NDA |
| Personen-Daten in Stichproben | ✓ Pseudonymisiert oder anonymisiert vor Verarbeitung in Soizburg-Tools |
| Daten-Löschung | ✓ 90 Tage nach Audit-Abschluss alle Stichproben in Soizburg-Systemen gelöscht |
Was schiefgehen kann, und wie wir damit umgehen.
| Risiko | Wie wir es lösen |
|---|---|
| Sehr große Daten-Mengen (>10 Mio Datensätze pro Quelle) | Stratifizierte Stichproben statt Vollscan. Mehraufwand bleibt bei Soizburg. |
| Keine API-Verfügbarkeit auf Hauptquelle | Manuelle Exporte vom Kunden ergänzen, im Bericht klar markiert. |
| DSGVO-kritische Daten (Gesundheits-, Bonitäts-Daten) | Nur aggregierte Stichproben, keine Einzeldaten in Soizburg-Tools, NDA-Pflicht im Onboarding. |
| Bereinigungs-Aufwand wird nicht umgesetzt | Das Audit bleibt valide. Du kannst auch in 6 Monaten umsetzen, mit oder ohne uns. |
So sieht das in Deiner Branche aus.
Klick auf Deine Branche für konkrete Beispiele aus unseren Projekten und dem Soizburg-AI-Kompass.
Hotellerie
Kanzleien
Handwerk
Ordinationen
Maklerbüros
Online-Shops
Industrie
Was als nächstes Sinn ergibt.
| Folge-Schritt | Wann sinnvoll | Modell |
|---|---|---|
| KI-Wissensdatenbank (RAG) | Wenn aufgeräumte Daten in einer durchsuchbaren Wissensbasis verfügbar sein sollen | Custom-Build · 150 €/h netto |
| Datenbereinigungs-Umsetzung | Wenn der Bereinigungs-Plan umgesetzt werden soll | Custom-Build · 150 €/h netto |
| Automatisierung Dokumente | Wenn unstrukturierte Dokumente OCR-strukturiert werden sollen | Custom-Build · 150 €/h netto |
| KI-Analyse | Wenn die Daten-Basis steht und KI-Use-Cases priorisiert werden sollen | Festpreis 450 € netto |
FAQ.
Was ist KI-Tauglichkeit von Daten?
Was, wenn Daten DSGVO-kritisch sind?
Wie viele Datenquellen kann das Audit prüfen?
Was ist der Unterschied zur Technologie-Analyse?
Lohnt sich das auch ohne aktuelles KI-Projekt?
Was bedeutet „Single Source of Truth"?
Wer schreibt den Bericht?
Verwandte Lösungen.
Daten-Analyse buchen
450 € netto · 7 Werktage · Inventar plus Qualitäts-Score plus Bereinigungs-Plan
Termin direkt buchen
Wir nutzen Cal.com für die Terminvereinbarung. Mit dem Klick wird das Buchungs-Widget direkt hier geladen, dabei stellt Dein Browser eine Verbindung zu Cal.com her und Cal.com setzt Cookies. Mehr im Datenschutz.
Noch nicht ganz klar, ob das die richtige Lösung für Dich ist?
Soizburg-AI-Kompass starten