Kunde
Verschiedene Kunden
Zeitraum
2022 & 2023
Projektart
Bundle / Package
Expertise
Data Engineering
Ausgangslage
Von 2016 bis 2022 waren wir offizieller HubSpot Partner (Marketing & Sales Software). Während dieser Zeit haben wir HubSpot in verschiedenen Unternehmen implementiert und weiterentwickelt. Dabei sind wir regelmässig über die mangelhafte Datenqualität von Kontakt- und Unternehmensdaten gestolpert. Dies brachte, durch den Aufwand der händischen Bereinigung dieser Daten, Projekte regelmässig ins Stocken.
Ausgehend davon, entschieden wir, eine Lösung für dieses Problem zu entwickeln. Entstanden ist Panda, unsere erste eigene Micro Software. Diese automatisiert, analysiert und optimiert die Qualität von Kontakt- und Unternehmensdaten – KI inklusive.
Ziele
- Reduktion des händischen Aufwands bei der Verbesserung der Datenqualität
- Automatisierte Analyse und Einschätzung über den Zustand der Daten
- Korrektur und Optimierung bestehender Daten mittels Regeln & künstlicher Intelligenz
- Aggregierung und Aktualisierung bestehender Daten mit externen Systemen
Vorgehen
In einem ersten Schritt behandelten wir das Thema Datenqualität konzeptionell (bspw. die Bereiche der Datenqualität: Korrektheit, Einzigartigkeit, usw.). Ausgehend davon, bildeten wir eine Bibliothek mit verschiedenen Befehlen, die laufend weiterentwickelt wird. Dies geschieht unter anderem mit Genera (Name des trainierten KI Modells), das mit Hilfe einer öffentlichen Namensdatenbank das Geschlecht für die Anrede prüft und bei Bedarf Anpassungen vornimmt. Aktuell haben wir einen verlässlichen Prototypen, den wir unseren Kund:innen und Partner:innen zur Verfügung stellen. Mithilfe von Inputs der User:innen entwickeln wir diesen stets weiter.
Ergebnisse
- Excel Sheet mit Reporting und Auswertung der Datenqualität
- Umfassende Liste mit Nachweis der Optimierungen einzelner Kontakte
- Optimierte Liste zur weiteren Nutzung (Import, usw.)
Wirkung
Gewisse Aspekte der Datenqualität (wie z.B. die interne Relevanz oder Informationen zur Beziehung) müssen weiterhin händisch verbessert oder bewirtschaftet werden. Vielmehr geht es mit Panda darum, den händischen Aufwand zu reduzieren und die Stammdaten den Nutzer:innen einheitlich, korrekt und in gleicher Formatierung zur Verfügung zu stellen. So bleibt mehr Zeit für den Unterhalt der qualitativen Datenfelder.
Severin Lindenmann, Consultant
severin@oberholzerkb.ch / +41 76 561 31 50