Suchen und Finden
Service
Daten- und Informationsqualität - Auf dem Weg zur Information Excellence
Knut Hildebrand, Marcus Gebauer, Holger Hinrichs, Michael Mielke
Verlag Vieweg+Teubner (GWV), 2011
ISBN 9783834899538 , 445 Seiten
2. Auflage
Format PDF, OL
Kopierschutz Wasserzeichen
Editorial
5
Danksagung
7
Grußwort Prof. Richard Wang
7
Inhaltsverzeichnis
9
A Informationsqualität – Grundlagen
11
1 Was wissen wir über Information?
12
1.1 Einleitung
12
1.2 Grundlegung
14
1.3 Information im Wissens- und Informationsmanagement
16
1.4 SHANNONsche Informationstheorie
20
1.5 STEINMÜLLERs Informationsmodell
23
1.5.1 STEINMÜLLERs System- und Prozessverständnis
23
1.5.2 Information als allgemeines Modell
24
1.5.3 Modell eines Informationssystems unter Einbezug der Semiotik
25
1.5.4 Fazit
27
1.6 Information als Produktionsfaktor
28
1.6.1 Perspektive der Produktionstheorie
28
1.6.2 Produktionsfaktor Information
30
1.6.3 Fazit
31
1.7 Zusammenfassung des Beitrages
31
Literaturverzeichnis
32
2 Informationsqualität – Definitionen, Dimensionen und Begriffe
34
2.1 Einleitung
34
2.2 IQ-Dimensionen und Definitionen
35
2.2.1 Die 15 IQ-Dimensionen im Überblick:
37
2.2.2 Graphische Darstellung der 15 IQ-Dimensionen und 4 IQ-Kategorien
38
2.2.3 Die 15 IQ-Dimensionen: Definitionen und Beispiele
41
2.2.3.1 Zugänglichkeit (accessibility):
41
2.2.3.2 Angemessener Umfang (appropriate amount of data):
42
2.2.3.3 Glaubwürdigkeit (believability):
43
2.2.3.4 Vollständigkeit (completeness):
43
2.2.3.5 Übersichtlichkeit (concise representation):
44
2.2.3.6 Einheitliche Darstellung (consistent representation):
45
2.2.3.7 Bearbeitbarkeit (ease of manipulation):
46
2.2.3.8 Fehlerfreiheit (free of error):
46
2.2.3.9 Eindeutige Auslegbarkeit (interpretability):
47
2.2.3.10 Objektivität (objectivity):
48
2.2.3.11 Relevanz (relevancy):
48
2.2.3.12 Hohes Ansehen (reputation):
49
2.2.3.13 Aktualität (timeliness):
50
2.2.3.14 Verständlichkeit (understandability):
51
2.2.3.15 Wertschöpfung (value-added):
51
2.2.3.16 Vollständigkeit der IQ-Dimensionen
52
2.3 Zusammenfassung und Ausblick
53
Literaturverzeichnis
54
B Methoden – Techniken – Tools – Regelwerke/Standards
55
1 Datenqualitätsmetriken für ein ökonomisch orientiertes Qualitätsmanagement
56
1.1 Einleitung
56
1.2 Anforderungen an Datenqualitätsmetriken
58
1.3 Bisherige Beiträge zur Messung von Datenqualität
58
1.4 Metriken und Messverfahren für DQ
61
1.4.1 Metrik für die DQ-Dimension Vollständigkeit
61
1.4.2 Metrik für die DQ-Dimension Fehlerfreiheit
64
1.4.3 Metrik für die DQ-Dimension Konsistenz
67
1.4.4 Metrik für die DQ-Dimension Aktualität
69
1.5 Praktische Anwendung der Metrik für Aktualität
71
1.6 Zusammenfassung und Ausblick
72
Literaturverzeichnis
73
2 Datenqualitätsmanagement – Steigerung der Datenqualität mit Methode
75
2.1 Die Bedeutung des Total Data Quality Management
75
2.1.1 Vorgehensmodelle
76
2.1.2 Datenqualitätsmanagement sichert Ihren Unternehmenserfolg
77
2.2 Phasen eines ganzheitlichen Datenqualitätsmanagements
77
2.2.1 Initiierung des Datenqualitätsprojekts
78
2.2.2 Definition der Datenqualitätsanforderungen
81
2.2.3 Messung der vorhandenen Datenqualität
85
2.2.4 Analyse der Fehlerursachen
88
2.2.5 Verbesserung der Datenqualität
90
2.2.6 Permanente Überwachung der Datenqualität
92
2.3 Anreize für ein Datenqualitätsmanagement
92
Literaturverzeichnis
94
3 Strukturierte Datenanalyse, Profiling und Geschäftsregeln
95
3.1 Datenqualität
95
3.2 Merkmale der Datenqualität
97
3.3 Geschäftsregeln
100
3.4 Methoden der Datenanalyse
101
3.5 Metriken im Detail
103
3.6 Datenqualität in der Anwendung
105
Literaturverzeichnis
108
4 Datenbereinigung zielgerichtet eingesetzt zur permanenten Datenqualitätssteigerung
109
4.1 Definition "Datenbereinigung"
109
4.2 Ursachenanalyse
110
4.3 Bewertungskriterien für Datenfehler und Korrekturmaßnahmen
111
4.4 Methoden des Datenqualitätsmanagements
115
4.5 Datenqualitätsmaßnahmen im Detail
117
4.6 Zusammenfassung
129
5 Datenintegration und Deduplizierung
130
5.1 Schritt 1: Schema Matching
133
5.2 Schritt 2: Dublettenerkennung
136
5.2.1 Auswirkungen von Dubletten
136
5.2.2 Entstehung von Dubletten
138
5.2.3 Erkennen von Dubletten
138
5.2.3.1 Ähnlichkeitsmaße
139
5.2.3.2 Ähnlichkeit auf Datensatzebene
140
5.2.4 Durchführung der Dublettenerkennung
140
5.3 Schritt 3: Datenfusion
142
5.3.1 Konflikte ignorieren
143
5.3.2 Konflikte vermeiden
143
5.3.3 Konflikte auflösen
144
5.4 Erweiterungen
146
5.4.1 Strukturierung
146
5.4.2 Standardisierung
146
5.5 Zusammenfassung
148
Literaturverzeichnis
148
6 Definition von Datenarten zur konsistenten Kommunikation im Unternehmen
150
6.1 Einleitung und Zielsetzung
150
6.1.1 Informationsqualität und Datenarten
151
6.2 Datenarten in der Informationslandschaft
151
6.3 Beschreibungskriterien
152
6.3.1 Beschreibung der Eigenschaften
153
6.3.1.1 Format
153
6.3.1.2 Struktur
153
6.3.1.3 Inhalt
153
6.3.1.4 Stabilität
154
6.3.1.5 Verarbeitung
155
6.3.1.6 Business Object
155
6.3.2 Beschreibung des Kontextes
156
6.3.2.1 Prozess
156
6.3.2.2 Zweck
157
6.4 Beispiele für den Praxiseinsatz
158
6.4.1 Analyseebenen der Informationsqualität
158
6.4.2 Visualisierung des IQ-Status
159
6.5 Zusammenfassung
163
Literaturverzeichnis
163
7 Suchmaschinen und Informationsqualität: Status quo, Problemfelder, Entwicklungstendenzen1
164
7.1 Ausgangssituation
164
7.2 Charakterisierung algorithmenbasierter Suchmaschinen
165
7.2.1 Funktionsweise algorithmenbasierter Suchmaschinen
165
7.2.2 Anfrageabhängige Ranking-Faktoren
166
7.2.3 Anfrageunabhängige Ranking-Kriterien
168
7.3 Semantisches Web und semantische Suchmaschinen
170
7.3.1 Vision und Grundlagen des semantischen Webs
170
7.3.2 Technische Grundlagen des semantischen Web
173
7.3.3 Problemfelder und Herausforderungen im Bereich der semantischen Suche
174
7.4 Fazit und Ausblick
176
Literaturverzeichnis
177
8 Bedeutung der Informationsqualität bei Kaufentscheidungen im Internet1
179
8.1 Einleitung
179
8.2 Informationsqualität in Entscheidungsprozessen
180
8.2.1 Informationen und Kaufentscheidungen
180
8.2.2 Informationsqualitätskriterien
181
8.3 Ursachen mangelnder Informationsqualität im Internet
184
8.3.1 Opportunistische Verhaltensspielräume der Anbieter
184
8.3.2 Informationsqualität aus der Nachfragerperspektive
187
8.3.3 Gründe für Opportunismus im Internet
191
8.3.3.1 Das strategische Kalkül der Anbieter
191
8.3.3.2 Der Wandel von Sucheigenschaften zu Erfahrungseigenschaften
192
8.3.3.3 Weitere Besonderheiten im Internet
193
8.4 Fazit und Handlungsempfehlungen
196
Literaturverzeichnis
199
9 Datenqualitäts-Audits in Projekten
205
9.1 Einleitung
205
9.2 Abstimmung mit anderen Regelwerken
206
9.3 Glossar
207
9.4 Gebrauch der Generischen Checkliste
207
9.5 Datenqualitätsbewertung einer Datensammlung
210
9.5.1 Anforderungen an das Management
210
9.5.2 Service Level Agreements
211
9.5.3 Organisatorische Spezifikationen
212
9.5.4 Prozess-Definitionen
213
9.5.5 Datensammlung, Datenverarbeitung und Datennutzung
215
9.5.6 Messung, Maßnahmen und Überwachung
216
9.5.7 Technische Anforderungen
217
9.5.8 Dokumentation
219
9.6 Zusammenfassung
220
10 Bewertung der Informationsqualität im Enterprise 2.01
221
1.1 Einführung
221
1.2 Aktuelle Bewertungssysteme im Web 2.0
222
1.2.1 Wikipedia
222
1.2.2 Google Knol
222
1.2.3 Helium.com
223
1.3 Beurteilung der Informationsqualität einer Enterprise 2.0 Wissensplattform mittels eines hybriden Ansatzes
224
1.3.1 Automatische Beurteilung der Informationsqualität
224
1.3.2 Implizites Nutzer-Feedback
226
1.3.3 Explizites Nutzer-Feedback
228
1.3.4 Zusammenwirken der drei Ansätze und Fazit
229
Literaturverzeichnis
230
C Organisation
233
1 Organisatorische Ansiedlung eines Datenqualitätsmanagements
234
1.1 Einführung
234
1.1.1 Motivation
234
1.1.2 Gliederung des Kapitels
235
1.2 Datenqualitätsmanagement – Entwicklungsstufen und Aufgaben
236
1.2.1 Sicherung der Datenqualität
236
1.2.2 Management der Datenqualität
237
1.3 Datenqualitätsmanagement – Ansiedlung im Unternehmen
238
1.3.1 Kopplung von Datenqualitätsmanagement mit anderen Unternehmensbereichen
239
1.3.2 Folgerungen für die Ansiedlung eines Datenqualitätsmanagements
241
1.4 Datenqualitätsmanagement in Projekten
242
1.4.1 Aufgaben des Datenqualitätsmanagements in Projekten
242
1.4.2 Organisatorische Verankerung des Datenqualitätsmanagements in Projekten
242
1.5 Zusammenfassung und Ausblick
244
1.5.1 Zusammenfassung
244
1.5.2 Ausblick
244
Literaturverzeichnis
245
2 Organisatorische Maßnahmen für gute Datenqualität
246
2.1 Messungen, Ursachen und generische Ansätze
246
2.1.1 Möglichen Arten von Datenqualitätsmängeln
246
2.1.2 Datenqualitätsmängel – Entstehung und Bekämpfung
247
2.1.3 Vier Generische Ansätze
248
2.1.3.1 Ansatz 1: Verantwortung, Messen und Publizieren
248
2.1.3.2 Ansatz 2: Freiheit und Führung
249
2.1.3.3 Ansatz 3: Standards setzen und durchsetzen
249
2.1.3.4 Ansatz 4: Durchgängige Definitionen festlegen
250
2.2 Aus den generischen Ansätzen abgeleitete Strategien
250
2.3 Strategie A: Transparenz schafft Vertrauen
251
2.3.1 Ansatzpunkt dieser Strategie
251
2.3.2 Nutzen dieser Strategie
251
2.3.3 Nachteile und Risiken dieser Strategie
251
2.4 Strategie B: Definition von Verantwortlichkeiten
252
2.4.1 Ansatzpunkt dieser Strategie
252
2.4.2 Positionierung dieser Businessrollen im Modell
252
2.4.2.1 Der Process Owner
253
2.4.2.2 Der Data Owner
253
2.4.2.3 Der Data Definition Owner und Data Consumer
253
2.4.2.4 Der Data Provider
254
2.4.3 Nutzen dieser Strategie
254
2.4.4 Nachteile und Risiken dieser Strategie
254
2.5 Strategie C: gezielt Abhängigkeiten suchen
254
2.5.1 Ansatzpunkt dieser Strategie
254
2.5.2 Gezielte Definition von Master und Slave
255
2.5.3 Nutzen dieser Strategie
256
2.5.4 Nachteile und Risiken dieser Strategie
256
2.6 Strategie D: Daten-Lifecycle auf Basis des Prozesses
257
2.6.1 Ansatzpunkt dieser Strategie
257
2.6.2 Der Prozess und Lebenszyklus
257
2.6.3 Nutzen dieser Strategie
258
2.6.4 Nachteile und Risiken dieser Strategie
258
2.7 Strategie E: Niederschwellige Verbesserungs-Werkzeuge
259
2.7.1 Ansatzpunkt dieser Strategie
259
2.7.2 Beispiel eines niederschwelligen Verbesserungs-Werkzeuges
259
2.7.2.1 Schritt 1 – Einstieg über die Management-Sicht
259
2.7.2.3 Schritt 2 – Detaillisten für das Fehlertracking
259
2.7.2.5 Schritt 3 – Die Verbesserung der Datenqualität
260
2.7.3 Die Infrastruktur dieses Werkzeuges
260
2.7.5 Nutzen dieser Strategie
261
2.7.6 Nachteile und Risiken dieser Strategie
261
2.8 Vor- und Nachteile aller erwähnter Strategien
261
2.8.1 Der Prozess ist die Vorgabe
261
2.8.2 Das Saatkorn ist der Beginn
261
2.8.3 Komplexität des Systems und Datenvolumen
262
2.9 Vorgehen bei der Umsetzung dieser Strategien
262
2.9.1 Kontakt zwischen den Parteien
262
2.9.2 Management-Unterstützung
262
2.10 Schlussfolgerungen und Ausblick
262
Literaturverzeichnis
264
3 Informationsmanagementprozesse im Unternehmen
265
3.1 Motivation
265
3.2 Ausgangslage
265
3.3 Bewertung
267
3.4 Informationsmanagementprozess
269
3.5 Schema einer Informationsplanung
271
3.6 Datenlandkarte und Datenarchitektur
272
3.7 Geschäftsprozesse und Informationsmanagementprozess
275
3.8 Qualitätsaspekte
276
3.9 Ökonomische Aspekte
280
3.10 Zusammenfassung
281
Literaturverzeichnis
281
4 Data Governance
282
4.1 Einführung
282
4.2 Stand der Wissenschaft und Praxis
284
4.2.1 Abgrenzung des DQM
284
4.2.2 Bedeutung des Governance-Begriffs
284
4.2.3 Data Governance
285
4.2.4 Grundmuster für IT Governance
286
4.2.5 Einflussfaktoren auf IT Governance
287
4.3 Ein Modell für Data Governance
289
4.3.1 Rollen
289
4.3.2 Aufgaben
291
4.3.3 Zuständigkeiten
293
4.3.4 Einflussfaktoren und Gestaltungsparameter
295
4.4 Zusammenfassung
298
Literaturverzeichnis
299
5 IQM-Reifegradmodell für die Bewertung und Verbesserung des Information Lifecycle Management Prozesses
301
5.1 Einleitung
301
5.2 Hintergrund
302
5.2.1 Total Quality Management
302
5.2.2 QM-Reifegrad
303
5.2.3 Information Quality Management
303
5.2.4 Existierende IQM-Reifegradmodelle
305
5.3 Methodologie
305
5.3.1 Die Delphi-Methode
305
5.4 IQM-Reifegradmodell
306
5.4.1 Chaotisch
307
5.4.2 Reaktiv
308
5.4.3 Messend
308
5.4.4 Steuernd
309
5.4.5 Optimierend
309
5.5 Zusammenfassung und Ausblick
310
Literaturverzeichnis
310
6 Master Data Life Cycle – Stammdatenprozesse in SAP am Beispiel Materialstamm
314
6.1 Stammdaten – die Grundlage der Informationssysteme
314
6.2 Stammdatenqualität führt zu Prozessqualität
316
6.2.1 Qualitätseigenschaften
316
6.3 Probleme der Datenqualität und ihre Auswirkungen
316
6.4 Master Data Life Cycle (MDLC) – der Stammdatenprozess
317
6.4.1 Statuskonzept
317
6.5 Hindernisse und Problemfälle
321
6.6 Implementierung des MDLC
322
Literaturverzeichnis
323
D Praxisbeispiele
324
1 Ein Entscheidungsmodell zur Weitergabe persönlicher Daten im Internet
325
1.1 Einleitung
325
1.2 Entscheidungsmodell
326
1.2.1 Intention
328
1.2.2 Nutzen
329
1.2.3 Vertrauen
331
1.2.4 Datenarten
334
1.2.5 Eingabefehler
336
1.3 Ausblick
336
Literaturverzeichnis
338
2 Einführung eines proaktiven DQ-Managements
339
2.1 Die Bremer Landesbank
339
2.1.1 Der Auftrag
339
2.2 Proaktives Datenqualitätsmanagement
340
2.3 Datenqualitätsorganisation
341
2.4 Eskalationsinstanz
343
2.5 Reporting
343
2.6 Messung von Datenqualität
343
2.6.1 Die Themen
344
2.6.1.1 Abgleich KIS mit Kondor+
344
2.6.1.2 Adressdatenabgleich zwischen externem Dienstleister und KIS
345
2.6.1.3 Datenabgleich zwischen KUKA und KIS
345
2.6.1.4 Legitimationsdaten
346
2.6.1.5 Messung inaktiver Kunden
346
2.6.1.6 Messung vollständiger Hinterlegung von Telefonnummern
346
2.6.1.7 Ermittlung von Dubletten
347
2.6.2 Messsysteme
348
2.6.3 Messung bankfachlicher Datenzusammenhänge
349
2.7 Visualisierung der Messergebnisse
350
2.8 Messergebnisse und Fazit
355
3 Informationsqualität für das Management mit TOPAS®
356
3.1 Informationsmanagement für Führungskräfte
356
3.1.1 Qualitätskriterien von Informationen für das Management
357
3.1.2 Absicherung der Informationsqualitätskriterien: TOPAS® -Methodik
357
3.2 TOPAS®: Methode und Modell
358
3.2.1 Geschäftsprozessmanagement (GPM) mit der TOPAS-Methode
358
3.2.2 Regelkreis für das Geschäftsprozessmanagement
358
3.2.3 4-Ebenen-Modell (Business Excellence Kriterien)
359
3.3 Anwendung: Management von Informationen und Daten
363
3.3.1 Informationen über Strukturen und Abläufe
363
3.3.2 Informationen und Daten für die strategische und operative Planung
364
3.4 Informationserfassung
366
3.4.1 Quellen zur Informationserfassung
367
3.4.2 Anforderungen zur Sicherung der Informationsund Datenqualität
367
3.5 Informationsverarbeitung
367
3.5.1 Operative Planung, Ziele
368
3.5.2 Festlegung von Kennzahlenstrukturen (KPI7) in der Balanced Scorecard
368
3.5.3 Sicherung der Informationsund Datenqualität: Kennzahlensteckbrief
369
3.5.4 Erfolgskontrolle via KPIs: Reviews und Audits
370
3.6 Informationsdarstellung
371
3.6.1 Standard-Reporting mit dem TOPAS®-Prozessmodell
371
3.6.2 IT-Portal für das Management: Business Cockpit
371
3.6.3 Effizienzsicherung der Prozess-Architektur
372
3.6.4 Identifizierung von Korrekturmaßnahmen und Kontinuierlicher Verbesserungsprozess (KVP)
372
3.7 Wirkungsspektrum von TOPAS®
373
Literaturverzeichnis
375
4 Datenqualitäts-Modell der Volkswagen Financial Services AG
376
4.1 Einleitung
376
4.2 Das Projekt „Datenqualität Strukturen/Standards und Drittmarktfähigkeit"
378
4.2.1 Warum ist Datenqualität nötig?
378
4.2.2 Projektauftrag
378
4.2.2.1 Erster Themenblock
378
4.2.2.2 Zweiter Themenblock
378
4.2.3 Projektziel
379
4.2.4 Ist-Analyse
379
4.2.4.1 Drittmarkt
379
4.2.4.2 Datenqualitätsanspruch
379
4.2.4.3 Verantwortlichkeiten
380
4.2.4.4 Kunden
380
4.2.5 Prozessanalyse
380
4.2.6 Sollkonzept
381
4.2.6.1 Ausrichtung Datenqualität
381
4.2.6.2 Ausrichtung Drittmarktfähigkeit
382
4.2.6.3 Aufbau-/ Ablauforganisation
383
4.2.7 Das Datenqualitäts-Modell und deren Zuständigkeiten
384
4.2.7.1 Datenqualitätsmanagement (zentrales DQM)
385
4.2.7.2 Data Owner (dezentral)
387
4.2.7.3 Client Owner (dezentral)
388
4.2.7.4 Client Service (Benutzergruppen)
389
4.2.7.5. Freigabe- und Eskalationsprozesse
389
4.2.8 Das Datenqualitäts-Modell und sein Regelwerk
390
4.2.9 Monitoring/Reports
391
4.2.10 Realisierungsund Einführungsphase
392
4.3 Fazit
392
5 Verknüpfung von DQ-Indikatoren mit KPIs und Auswirkungen auf das Return on Investment
394
5.1 Beispiele zur Illustration von DQ-Problemen
395
5.2 Wie wirken sich DQ-Probleme auf Unternehmen aus – Der Zusammenhang zwischen Datenund Prozessqualität
396
5.2.1 Beispiel – Call Center
396
5.2.2 Beispiel – Kundenbeziehungsmanagement (CRM)
397
5.2.3 Beispiel – Data Mining Prozess im Marketingumfeld
398
5.2.4 Beispiel – Direktmailprozess
399
5.3 Wie viel kosten schlechte Daten den Unternehmer?
401
5.4 Der Einfluss von DQ-Indikatoren auf KP-Indikatoren – wie beeinflusst Datenqualität den Unternehmenserfolg?
402
5.5 Beschreibung eines KPI orientierten DQ- Managementprozesses
405
5.5.1 Phase 1- Selektiere zu untersuchende Komponenten
406
5.5.2 Phase 2 – Mitarbeiterbefragung
407
5.5.3 Phase 3 – DQ-Assessment
409
5.5.4 Phase 4 – Validieren und Quantifizieren
410
5.5.5 Phase 5- DQ-Projekte definieren, Korrekturmaßnahmen durchführen
411
5.6 Fallstudie – Banque Cantonale Vaudoise (BCV)
413
Literaturverzeichnis
416
Über die Autorinnen und Autoren
417
Ahlheid, Sven
417
Baškarada, Saša
417
Dipl.-Inform. Bleiholder, Jens
418
Dr. rer. nat. Block, Frank
418
Dr. Brust, Otto-Ernst
419
Dipl.-Kfm. Engelmann, Florian
419
Dr. Gebauer, Marcus
420
Dr. rer. pol. Gräfe, Gernot
421
cand. oec. Großmann, Christoph
421
Prof. Dr. Heinrich, Bernd
422
Prof. Dr. rer. pol. Hildebrand, Knut
423
Prof. Dr.-Ing. Hinrichs, Holger
423
Diplom Verwaltungswirt Kasten, Gerhard
424
Dr. Klier, Mathias
424
Dipl.-Kfm. Krebs, Alexander
425
Landt, Volker
426
M.A., Prof. Dr. rer. nat. Lüssem, Jens
427
Dr. Maaß, Christian
427
Dipl.-Math. Malzahn, Dirk
428
Dipl. Kaufmann Mielke, Michael
428
Dr. rer. nat. Möller, Frank
429
Moser, Helena
430
Dr. Otto, Boris
430
M. A. Piro, Andrea
431
Dr. rer. pol. Rohweder, Jan Philipp
431
Dipl.-Inform. Schmid, Joachim
432
Dr. Schuster, Dirk
432
Dipl.-Ökonom Schwinn, Klaus
433
Skrablies, Werner
434
PD Dr. Treiblmaier, Horst
434
Dr. Weber, Kristin
435
Weigel, Niels
435
Dr. Windheuser, Ulrich
436
Wolf, Jürg
436
Zwirner, Marcus
437
Stichwortverzeichnis
438