Rozdział 2. Dane

W tym rozdziale zapoznamy się ze zbiorem danych, na którym będziemy pracować w dalszej części książki; będzie to mianowicie nasza własna skrzynka odbiorcza poczty elektronicznej. Zapoznamy się też z szeregiem wykorzystywanych później narzędzi i przedstawimy uzasadnienie dla takiego, a nie innego ich wyboru. Na koniec zakreślimy perspektywy, które będziemy stosować w analizie danych.

Książka zaczyna się od danych, bo w zwinnym Big Data nasz proces też zaczyna się od danych.

Podpowiedź

Kto nie posiada konta pocztowego Gmail (http://mail.google.com), powinien je na potrzeby ćwiczeń założyć i zapełnić przykładowymi wiadomościami.

E-mail

Poczta elektroniczna, albo po prostu e-mail, to podstawowa usługa internetu. Jest nawet czymś więcej: ...

Get Zwinna analiza danych. Apache Hadoop dla każdego now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.