Suchen und Finden
Service
Infos und Kontakt
Inhalt
5
Einleitung
9
Voraussetzungen
9
Form der Beispiele
10
Warum Python?
10
Python-Tipps
11
Offene APIs
13
Überblick über die Kapitel
14
Konventionen
16
Die Codebeispiele zu diesem Buch
16
Die Codebeispiele verwenden
17
Danksagung
17
Kapitel 1 Einführung in die kollektive Intelligenz
19
Was ist kollektive Intelligenz?
20
Was ist maschinelles Lernen?
22
Grenzen des maschinellen Lernens
23
Beispiele aus dem richtigen Leben
23
Andere Anwendungen für lernende Algorithmen
24
Kapitel 2 Empfehlungen geben
27
Kollaboratives Filtern
28
Vorlieben sammeln
28
Ähnliche Benutzer finden
30
Welchen Similarity Score sollten Sie nutzen?
34
Dinge empfehlen
36
Produkte finden
38
Link-Empfehlungen mit del.icio.us erstellen
40
Elementbasiertes Filtern
44
Verwenden der MovieLens-Daten
47
Benutzerbasiertes oder elementbasiertes Filtern?
49
Übungen
50
Kapitel 3 Gruppen bilden
51
Überwachtes versus unüberwachtes Lernen
52
Wortvektoren
52
Hierarchische Clusteranalyse
55
Zeichnen des Dendrogramms
61
Spalten-Clusteranalyse
63
K-Means-Clusteranalyse
65
Cluster mit Vorlieben
68
Daten in zwei Dimensionen betrachten
73
Andere Dinge in der Clusteranalyse
76
Übungen
77
Kapitel 4 Suchen und Bewerten
79
Was gehört zu einer Such-Engine?
79
Ein einfacher Crawler
81
Aufbauen des Index
84
Abfragen
89
Contentbasierte Bewertung
90
Eingehende Links verwenden
96
Aus Klicks lernen
101
Übungen
112
Kapitel 5 Optimierung
114
Gruppenreisen
115
Lösungen repräsentieren
116
Die Zielfunktion
117
Random Search
120
Bergsteigen
121
Simulierte Abkühlung
124
Genetische Algorithmen
126
Echte Flugsuchen
130
Optimierung nach Vorlieben
136
Netzwerkvisualisierung
140
Andere Möglichkeiten
146
Übungen
146
Kapitel 6 Dokumente filtern
148
Spam filtern
149
Dokumente und Wörter
149
Trainieren des Klassifizierers
151
Wahrscheinlichkeiten berechnen
153
Ein naiver Klassifizierer
155
Die Fisher-Methode
160
Die trainierten Klassifizierer persistieren
164
Blog-Feeds filtern
166
Merkmalserkennung verbessern
169
Akismet
171
Alternative Methoden
173
Übungen
174
Kapitel 7 Modellieren mit Entscheidungsbäumen
176
Anmeldungen vorhersagen
176
Entscheidungsbäume
179
Trainieren des Baums
180
Die beste Aufteilung wählen
181
Rekursiver Aufbau des Baums
184
Anzeigen des Baums
186
Klassifikation neuer Beobachtungen
189
Zurechtstutzen des Baums
191
Umgang mit fehlenden Daten
193
Umgang mit numerischen Ergebnissen
194
Modellieren von Immobilienpreisen
195
Modellieren der »Hotness«
198
Wann nutzt man Entscheidungsbäume?
201
Übungen
202
Kapitel 8 Aufbauen von Preismodellen
204
Aufbau eine Beispiel-Datenmenge
205
k-nächste Nachbarn
206
Gewichtete Nachbarn
210
Kreuzvalidierung
214
Heterogene Variablen
216
Optimieren der Skalierung
220
Ungleiche Verteilungen
221
Nutzung echter Daten – die eBay-API
228
Wann man k-nächste Nachbarn nutzt
235
Übungen
235
Kapitel 9 Komplexe Klassifikation: Kernel- Methoden und SVMs
237
Datenmenge für Vermittler
237
Schwierigkeiten mit den Daten
239
Einfache lineare Klassifikation
242
Kategoriale Eigenschaften
246
Skalieren der Daten
251
Kernel-Methoden verstehen
252
Support-Vektor-Maschinen
256
Verwenden der LIBSVM
258
Vermitteln bei Facebook
261
Übungen
267
Kapitel 10 Unabhängige Merkmale finden
269
Eine Nachrichtensammlung
270
Vorangegangene Ansätze
274
Nicht-negative Matrix-Faktorisierung
277
Anzeigen der Ergebnisse
284
Daten des Aktienmarkts nutzen
288
Übungen
294
Kapitel 11 Entwickeln von Intelligenz
295
Was ist genetische Programmierung?
296
Programme als Bäume
298
Erzeugen der initialen Population
303
Testen einer Lösung
304
Mutieren von Programmen
306
Crossover
309
Aufbau der Umgebung
311
Ein einfaches Spiel
314
Weitere Möglichkeiten
319
Übungen
322
Kapitel 12 Zusammenfassung der Algorithmen
324
Bayes-Klassifizierer
324
Entscheidungsbaum-Klassifizierer
328
Neuronale Netze
333
Support-Vektor-Maschinen
337
k-nächste Nachbarn
342
Clusteranalyse
346
Multidimensionales Skalieren
350
Nicht-negative Matrix-Faktorisierung
352
Optimierung
355
Anhang A Fremdbibliotheken
358
Universal Feed Parser
358
Python Imaging Library
359
Beautiful Soup
360
pysqlite
360
NumPy
361
matplotlib
362
pydelicious
363
Anhang B Mathematische Formeln
365
Euklidischer Abstand
365
Korrelationskoeffizient nach Pearson
366
Gewichtetes Mittel
367
Tanimoto-Koeffizient
367
Bedingte Wahrscheinlichkeit
368
Gini-Index
368
Entropie
369
Varianz
370
Gauß-Funktion
370
Skalarprodukt
371
Index
373
Über den Autor
387
Über den Übersetzer
387
Kolophon
387
Mehr eBooks vom gleichen Verlag
Einführung in SQL - Mit Übungen und Lösungen, von: Alan Beaulieu, Preis: 24,00 EUR
Alle Preise verstehen sich inklusive der gesetzlichen MwSt.; Ersparnis im Vergleich zur Printversion

















