Nauka o danych, znana również pod nazwą data science, jest stosunkowo nową, interdyscyplinarną dziedziną, zajmującą się różnymi technikami analizy danych, ich implementacją i wykorzystywaniem do różnych celów.
Zalety nauki o danych doceniają specjaliści z wielu branż: analitycy biznesowi, statystycy, architekci oprogramowania i osoby zajmujące się sztuczną inteligencją. Tak naprawdę ta dziedzina nie koncentruje się na kodowaniu i bazach danych, ale raczej na metodach wyłuskiwania z danych najróżniejszych cennych informacji. Wartość tej wiedzy niejednokrotnie okazuje się ogromna.
Niniejsza książka jest przystępnym wprowadzeniem do nauki o danych. Jest przeznaczona dla osób, które chcą stosować techniki analizy danych w biznesie. Te techniki, opisane na podstawie praktycznych przypadków, to m.in. optymalizacja, prognozowanie i symulacja, a także sztuczna inteligencja, teoria grafów, analiza skupień i wykrywanie anomalii.
Dzięki tej książce nie tylko zrozumiesz zasady analizowania danych, ale także nauczysz się wybierać technikę właściwą do rozwiązania danego problemu. Poznasz też techniki pracy z prototypami. Co ciekawe, niemal wszystkie opisane tu metody zostały zaprezentowane w arkuszu kalkulacyjnym.
W książce opisano m.in.
• optymalizację za pomocą programowania liniowego i całkowitoliczbowego
• szereg czasowy, wykrywanie trendów i wahań sezonowych
• przewidywanie za pomocą wygładzania wykładniczego
• metodę symulacji Monte Carlo
• test Tukeya i lokalne czynniki odstające
• język R — zaawansowane techniki analizy danych
Wyciśnij z danych każdą kroplę wiedzy!
John W. Foreman — jest głównym analitykiem danych w MailChimp.com. Udziela również porad dotyczących analizy danych takim podmiotom jak Coca-Cola czy Intercontinental Hotels, a także oraz amerykańskim agendom rządowym, włączając w to DoD, IRS, DHS i FBI. Często wygłasza prelekcje o rozwiązaniach analitycznych w biznesie.
Spis treści:
Wstęp (13)
1. Wszystko, co chciałeś wiedzieć o arkuszu kalkulacyjnym, ale bałeś się o to zapytać (21)
2. Analiza skupień. Część I - zastosowanie algorytmu centroidów do segmentowania bazy klientów (49)
3. Naiwny klasyfikator bayesowski i niezwykła lekkość bycia idiotą (97)
4. Modelowanie optymalizacyjne - "świeżo wyciśnięty" sok nie zamiesza się sam (123)
5. Analiza skupień. Część II - grafy i analiza sieci (179)
6. Regresja jako przodek nadzorowanego uczenia maszynowego i sztucznej inteligencji (227)
7. Modele zespołowe - dużo nie najlepszej pizzy (277)
8. Prognozowanie - oddychaj spokojnie, i tak nie wygrasz (313)
9. Wykrywanie obserwacji odstających - to, że jakiś element jest inny od pozostałych, nie oznacza, że jest nieistotny (365)
10. Przejście z arkusza kalkulacyjnego do języka R (393) Najniższa cena z 30 dni przed obniżką 59,25zł
Mistrz analizy danych. Od danych do wiedzy
|