W powszechnej świadomości duże zbiory danych, ich przetwarzanie i wykorzystanie kojarzy się z gigantami notowanymi na czołowych giełdach światowych. Odnosi się wrażenie, że jest to jakaś magiczna kraina do której wstęp mają nieliczni. Obiecuje ona wielkie bogactwa choć nie zawsze wiadomo dlaczego. Dodatkowo wierzy się, że wyprawa do tej mitycznej krainy jest trudna, droga i nie gwarantuje sukcesu, a zainteresowani mogą poczuć się jak bohaterowie filmu z Indiana Jones.
Istotnie, trzeba przyznać, że rozwiązania prezentowane w mediach bywają bardzo drogie. W szczególności mowa tu o dużej mocy obliczeniowej połączonej z rozwiązaniami chmurowymi nad którymi pracują całe zespoły informatyków i statystyków. Dlatego często za tymi sukcesami stoją giganci, którzy mają możliwości lokowania znaczących kwot w badania i rozwój. Na szczęście nie jest to jedyna droga do sukcesu o czym poniżej.
Krok pierwszy dane…
Przyglądają się uważnie małym firmom zauważymy, że efektem ich codziennego działania są właściwie dane. Jeśli mamy dane to możemy zacząć je przeglądać, żeby się czegoś dowiedzieć o swoim biznesie lub naszych klientach. Dokładnie tak robią duże firmy. Kiedy robimy np., zakupy w naszym ulubionym markecie dane o nas mogą być gromadzone i przetwarzane. Oczywiście zaraz poniosą się głosy, że ‘Oni’ mają duże zbiory danych a statystyka bazuje przecież … bla bla bla.
Faktycznie statystyka działa lepiej na dużych zbiorach danych, ale na małych też. Zresztą analiza danych to połączenie statystyki z logicznym wyciąganiem wniosków. Przykład? Załóżmy, że na ankietę odpowiedziało 16 klientów. Pan Statystyka powie, że nic się z tym nie da zrobić… Pan logiczne myślenie przyjrzy się danym. Jeśli 2-3 klientów narzekało w podobny sposób to jest znak, że może warto pochylić się nad tym tematem. Stąd, nawet małe zbiory danych pozwalają ulepszać nasze biznesy.
Krok drugi narzędzia…
Oczywiście wszystko wymaga odpowiedniego urządzenia. Dlatego ludzie stworzyli narzędzia dedykowane (to ważne) do danego zadania. Można wbijać gwóźdź w ścianę śrubokrętem ale znacznie lepiej użyć młotka. Teoretycznie można zakupić robota, który po odpowiednim zaprogramowaniu zrobi to za nas. Pomysł wydaje się atrakcyjny ale bardzo kosztowny.
Podobnie jest z analizowaniem danych. Z jednej strony mamy rozwiązania czołowych dostawców oprogramowania z drugiej strony koszty przekraczają możliwości małych i średnich przedsiębiorców.
Najprostszym rozwiązaniem może być wykorzystanie Excel, który w wielu przypadkach znakomicie się sprawdza jako narzędzie do raportowania oraz prostszych analiz danych. Potęgę tego narzędzia 24-EduStore prezentuje na dedykowanych szkoleniach. Niestety rozwiązanie wiąże się z kosztami.
Jak obniżyć koszty?
Odpowiedzią może być Pakiet R. W powszechnej opinie nadal kojarzący się ze środowiskiem akademickim czy pasjonatami analizy danych. Tymczasem to darmowe rozwiązanie oferujące gigantyczne możliwości co prezentujemy na naszych szkoleniach. Jeśli potrzebujemy dodatkowych możliwości wystarczy doinstalować nową bibliotekę i gotowe.
Praca z R przypomina trochę pisanie programu ale po opanowaniu podstaw składni okazuje się o wile prostsze. Dzisiaj dzięki odpowiednim nakładką służącym edycji wystarczy wydawać odpowiednie komendy żeby niemal dowolnie przekształcać i analizować dane.
Prawdziwą perełką oferowaną przez to narzędzie jest możliwość automatycznego generowania cyklicznych raportów czego uczymy na szkoleniu Pakiet R dla zaawansowanych.
Podsumowując Pakiet R to darmowe cały czas aktualizowane i rozwijane potężne narzędzie ukryte w niepozornej formie. Pakiety, pisane często przez ekspertów i pasjonatów pozwalają konkurować z sukcesem z czołowymi narzędziami do analizy danych.
Oczywiście w którymś momencie dojdziecie do etapu w którym będzie potrzebować tych wszystkich drogich rozwiązań o których mowa była na początku, ale wtedy będziecie na innym etapie waszego biznesu, etapu ‘Korpo’ czego Wam serdecznie życzę.