dummies
 
 

Suchen und Finden

Titel

Autor/Verlag

Inhaltsverzeichnis

Nur ebooks mit Firmenlizenz anzeigen:

 

Data Science für Dummies

Data Science für Dummies

von: Lillian Pierson

Wiley-VCH, 2016

ISBN: 9783527806751 , 382 Seiten

Format: ePUB

Kopierschutz: DRM

Windows PC,Mac OSX geeignet für alle DRM-fähigen eReader Apple iPad, Android Tablet PC's Apple iPod touch, iPhone und Android Smartphones

Preis: 23,99 EUR

Exemplaranzahl:  Preisstaffel

Für Firmen: Nutzung über Internet und Intranet (ab 2 Exemplaren) freigegeben

Derzeit können über den Shop maximal 500 Exemplare bestellt werden. Benötigen Sie mehr Exemplare, nehmen Sie bitte Kontakt mit uns auf.


Mehr zum Inhalt

Data Science für Dummies


 

Kapitel 1

Bei Data Science durchblicken

In diesem Kapitel

Data Science definieren

Data Science mithilfe seiner Schlüsselkomponenten definieren

Machbare Lösungen für Ihre eigenen Datenanforderungen bestimmen

Seit geraumer Zeit werden wir alle mit Daten total überschwemmt. Sie stammen von jedem Computer, jedem mobilen Gerät, jeder Kamera und jedem Sensor – und mittlerweile auch von Uhren und anderen tragbaren technischen Geräten. Sie werden bei jeder Aktion in den sozialen Netzwerken, bei jeder von uns gespeicherten Datei, bei jedem geschossenen Foto, jeder eingereichten Suchanfrage erzeugt. Auch wenn wir so etwas Einfaches machen, wie bei Google nach der nächsten Eisdiele zu suchen, entstehen viele Daten.

Obwohl das Eintauchen in Daten nichts Neues ist, haben Sie sicher bemerkt, dass sich das Phänomen beschleunigt. Seen, Pfützen und Flüsse von Daten haben sich in Fluten und wahre Tsunamis aus strukturierten, halbstrukturierten und nichtstrukturierten Daten verwandelt, die von fast jeder Aktivität ausströmen, die in der digitalen oder realen Welt stattfinden. Willkommen in der Welt von Big Data!

Sie haben sich vielleicht schon gewundert, »Was ist der Sinn dieser Daten? Warum wertvolle Quellen verwenden, um sie zu erzeugen und zu sammeln?« Obwohl schon vor einem Jahrzehnt niemand in der Lage war, groß Gebrauch von den erzeugten Daten zu machen, haben sich die Zeiten heute definitiv geändert. Als Daten-Ingenieure bezeichnete Spezialisten finden fortwährend innovative und leistungsstarke neue Wege, um unvorstellbar gewaltige Datenmengen zu fangen, zuzuordnen und zu verdichten. Andere Spezialisten, Datenforscher genannt, arbeiten daran, wertvolle und verfolgbare Einblicke aus diesen Daten zu gewinnen.

In ihrer reinsten Form steht Data Science für eine Optimierung von Prozessen und Quellen. Anhand von Data Science gewinnen Sie Einblicke in Daten – Einblicke, die Sie verwenden können, um Ihr Unternehmen, Ihre Investitionen, Ihre Gesundheit und auch Ihre Lebensführung und Ihr soziales Leben zu verstehen und zu verbessern. Für jedes vorstellbare Ziel oder Bestreben können Sie mit der Data Science Methoden finden, die Ihnen helfen, den direktesten Weg von dort, wo Sie sind, zu dem Punkt, wo Sie sein wollen, zu kennen und vorherzusagen und jedes Schlagloch auf dem Weg dazwischen vorauszusehen.

Schauen, wer von Data Science Gebrauch machen kann

Die Ausdrücke »Data Science« und »Data Engineering« werden oftmals falsch und inkonsistent verwendet, also lassen Sie mich hier beginnen, indem ich erkläre, dass diese beiden Bereiche in der Tat getrennte und unterschiedliche Fachgebiete sind. Data Science ist die Verwendung von Berechnungsverfahren, um nützliche und verfolgbare Erkenntnisse aus Ausgangsdaten abzuleiten. Data Engineering ist dagegen ein Ingenieurbereich, der den Zweck hat, Engpässe bei der Datenverarbeitung und Probleme bei der Behandlung von Daten für Anwendungen zu überwinden, die große Mengen, Arten und Geschwindigkeiten von Daten nutzen. Sowohl bei der Data Science als auch beim Data Engineering ist es üblich, mit den folgenden drei Arten von Daten zu arbeiten:

Strukturierte Daten: Daten, die in einem herkömmlichen relationalen Datenbanksystem gespeichert und verarbeitet wurden.

Unstrukturierte Daten: Daten, die gewöhnlich durch menschliche Aktivitäten erzeugt wurden und nicht in eine strukturierte Datenbank passen.

Halbstrukturierte Daten: Daten, die nicht in eine strukturierte Datenbank passen, die aber trotzdem durch Markierungen strukturiert sind, die nützlich sind, um eine Form von Ordnung und Hierarchie bei ihnen zu erzeugen.

Viele Leute glauben, dass nur große Organisationen, die über ausreichende finanzielle Mittel verfügen, Methoden der Data Science anwenden, um ihr Unternehmen zu optimieren und zu vervollkommnen, aber das ist nicht der Fall. Die Vermehrung der Daten hat eine Nachfrage nach Einblicken erzeugt, und diese Nachfrage ist in viele Aspekte unserer modernen Kultur eingebettet. Daten und die Notwendigkeit von Einblicken in diese Daten sind allgegenwärtig. Da Organisationen jeder Größe zu erkennen beginnen, dass sie in einer datengesteuerten, auf Wettbewerb ausgerichteten Umgebung mit einer Friss-oder-Stirb-Mentalität eingetaucht sind, entwickelt sich Daten-Fachwissen zum Herzstück und Rüstzeug in nahezu allen Geschäftsbereichen.

Was aber bedeutet das für einen normalen Menschen? Es heißt zunächst, dass sich unsere Kultur verändert hat und Sie sich auf dem Laufenden halten müssen. Das bedeutet nicht, dass Sie zurück in die Schule gehen und einen Abschluss in Statistik, Computerwissenschaften oder Data Science machen müssen. In dieser Hinsicht unterscheidet sich die Datenrevolution nicht so sehr von jeder anderen Veränderung, die die Industrie in der Vergangenheit getroffen hat. Tatsache ist: Um weiter aktuell zu bleiben, müssen Sie nur die Zeit und die Anstrengung aufbringen, um die Fähigkeiten zu erwerben, die Sie auf dem Laufenden halten. Wenn es darauf hinausläuft, zu lernen, wie Data Science anzuwenden ist, können Sie einige Kurse belegen, sich selbst mit im Netz zur Verfügung stehenden Quellen etwas beibringen, Bücher wie dieses lesen und Veranstaltungen besuchen, bei denen Sie lernen, was Sie wissen müssen, um in Bestform zu bleiben.

Wer kann Data Science verwenden? Sie können es. Ihr Betrieb kann es. Ihr Arbeitgeber kann es. Jeder, der ein wenig Verständnis und Übung hat, kann beginnen, Daten-zentrierte Sichtweisen zu verwenden, um sein Leben, seine Karriere und das Wohlergehen seines Unternehmens zu verbessern. Data Science stellt eine Änderung der Art und Weise dar, wie Sie an die Welt herangehen. Menschen sind es gewohnt, zu arbeiten und auf Ergebnisse zu hoffen, aber Dateneinblicke bieten die Vision, die die Menschen benötigen, um Veränderungen starten und Dinge gut ablaufen zu lassen. Sie können eine Daten-zentrierte Sichtweise verwenden, um die folgenden Änderungen zu bewirken:

Optimierung von betrieblichen Systemen und Kapitalrenditen (englisch Return on Investment, ROI) für jede messbare Aktivität.

Verbesserung der Effektivität von Verkäufen und Marketing-Initiativen, ob sie nun Teil einer betrieblichen Marketing-Kampagne oder lediglich ein persönlicher Aufwand sind, um bessere Beschäftigungsmöglichkeiten für sich selbst zu sichern.

Der Konkurrenz bei den allerneuesten Entwicklungen in jedem Bereich eine Nasenlänge voraus zu sein.

Gemeinschaften sicherer zu erhalten.

Die Welt für die zu einem besseren Platz zu machen, die weniger wohlhabend sind.

Die Teile des Data-Science-Puzzles betrachten

Um Data Science im eigentlichen Sinne des Wortes anzuwenden, benötigt man die analytischen Kenntnisse der Mathematik und Statistik, Programmierfertigkeiten und Fachkompetenz. Ohne Fachkompetenz könnten Sie sich auch Mathematiker oder Statistiker nennen. Genauso wie Software-Programmierer ohne Fachkompetenz und analytisches Fachwissen besser als Software-Ingenieur oder -Entwickler denn als Datenwissenschaftler betrachtet werden.

Da die Nachfrage nach einer Daten-zentrierten Sichtweise exponentiell wächst, ist jeder Bereich gezwungen, Data Science anzuwenden. Von daher haben sich verschiedene Richtungen von Data Science herauskristallisiert. Hier folgen nur ein paar Namen, unter denen Experten jeder Disziplin Data Science verwenden: Ad-Tech-Datenwissenschaftler, Banking Digital Analyst, Klinischer Datenwissenschaftler, Datenwissenschaftler der Geo-Ingenieurwissenschaften, Datenwissenschaftler der Geografie, Datenwissenschaftler im Personalbereich des Einzelhandels, Klinischer Informationsanalytiker im Bereich Pharmakometrie. Da es oftmals so scheint, dass man nicht die Übersicht darüber behalten kann, wer ein Datenwissenschaftler ohne Scorecard (= Ergebniskarte) ist, nehme ich mir in den folgenden Abschnitten die Zeit, um die Schlüsselkomponenten hier darzulegen, die ein Teil jeder Anwendung der Data Science sind.

Daten sammeln, abfragen und bearbeiten

Dateningenieure haben die Aufgabe, große Mengen von strukturierten, unstrukturierten und halbstrukturierten Big Data zu erfassen und zu sortieren; Daten, die die Verarbeitungskapazität herkömmlicher Datenbanken übersteigen, da sie zu umfangreich sind, sich zu schnell bewegen oder nicht die strukturellen Anforderungen herkömmlicher Datenbanken erfüllen. Um es noch einmal zu betonen, die Aufgaben von Dateningenieuren unterscheiden sich von der in der Data Science durchgeführten Arbeit, die ihren Schwerpunkt eher in der Analyse, Vorhersage und Sichtbarmachung hat. Trotz dieser Unterscheidung verrichtet ein Datenwissenschaftler, wenn er die zur Analyse notwendigen Daten sammelt, befragt und gebraucht, eine Arbeit, die große Ähnlichkeit mit der eines Dateningenieurs hat.

Obwohl...