DataInsiders.Space

#zerobuzzwords

Helping discover POWER OF DATA, as today, it’s all about data and its value!

MailChimp

Helping discover POWER OF DATA, as today, it’s all about data and its value!

MailChimp

#zerobuzzwords

W pogoni za zwinnością…

Na pierwszy artykuł w ramach DataInisders.Space wybraliśmy temat,  który pod koniec stycznia dość mocno rozgrzał dyskusje w świecie danych, w szczególności jeśli chodzi o wzorce projektowania rozwiązań wspierających raportowanie i analitykę w organizacjach. Przytoczę tutaj jedynie wizualne podsumowanie całego zagadnienia,  jako źródło do dalszej części tego wpisu. Sądzę, że dla wielu osób stanie się dość jasne o jakim trendzie ostatnich dni jest tutaj mowa: 

Żródło: https://databricks.com/blog/2020/01/30/what-is-a-data-lakehouse.html

Uwaga! 

To jest ten moment,w którym warto kliknąć na powyższy link, jeśli nie masz pełnej świadomości wspomnianego przeze mnie trendu. (Po przeczytaniu zapraszamy do kontynuowania lektury naszego artykułu)

Pierwszym elementem, który został podniesiony we wspomnianej dyskusji była kwestia wypracowywanych przed laty koncepcji hurtowni danych autorstwa Ralpha Kimball-a oraz Billa Inmon-a. Co ciekawe, o wiele więcej pojawiło się odwołań do podejścia Kimball-a, które jak wiadomo kładzie olbrzymi nacisk na kwestię przygotowania  danych na potrzeby raportowania i analizy, poprzez wyodrębnienie analizowanych obszarów, czyli wymiarów oraz analizowanych zdarzeń, czyli faktów. Po przeciwnej stronie szali postawiono najnowszą koncepcję (która o zgrozo, zyskała nawet swoją nazwę – czyżby kolejny #buzzwordalert w świecie danych?). Patrząc wyłącznie na jej wizualne podsumowanie, można dojść do wniosku, że cała transformacja danych oraz ich przygotowanie odbywa się w tym modelu niemal automatycznie, a poszczególne elementy funkcjonalne jak np. Business Intelligence, po prostu korzystają z gotowych danych ? Co więcej, wspomniane podejście pozwala na swobodną pracę z każdym typem danych, zarówno tymi bardziej i mniej uporządkowanymi. W tym miejscu warto zatrzymać się na moment i dokonać nieco głębszej analizy tego nowego, cudownego paradygmatu w obszarze przetwarzania danych. Bez wątpienia głównym atutem najnowszego podejścia jest wszechobecna zwinność i elastyczność wynikające głównie z niezależności warstwy gromadzenia danych i ich przetwarzania. Jednak czy aby na pewno, to  właściwy kierunek?

STOP! Zara zaraz, czy chcemy zatem powiedzieć, że przez ponad 30 lat nic nie zmieniło się w obszarze pracy z danymi i nadal powinniśmy podążać przetartą i nieco leciwą już ścieżką Źródło>Transformacja->Model->Raport,może jednak zwinność nowego podejścia, to jest właśnie to na co czekaliśmy, na co jesteśmy gotowi i co rozwiązuje wszelkie problemy świata danych? Otóż moim skromnym zdaniem nowa koncepcja bardzo dobrze wpasowuje się w dynamicznie zmieniające się pomysły na wykorzystanie danych. Gdy powstała koncepcja klasycznych hurtowni danych świat danych był z detfinicji bardziej uporządkowany jeśli chodzi o struktury danych, ale i narzędzia, które z tych danych korzystały. Dzisiaj pojawiły się zupełnie inne potrzeby i narzędzia sięgające do naszych danych, a tym samym nie zawsze te uporządkowane i przetworzone, do określonej postaci dane, pozwalają adresować pojawiające się potrzeby, czy raczej pomysły na ich biznesowe wykorzystanie. Właśnie dlatego od kilku lat na znaczeniu zyskuje budowanie centralnych repozytoriów danych, nie zawsze uporządkowanych, oczyszczonych i przetworzonych, które w kolejnym kroku stają się bazą do raportów, zaawansowanych analiz, czy też eksperymentów w obszarze uczenia maszynowego. Osobiście uważam,
że w całym tym pędzie w obszarze wykorzystania danych, zapominamy o aspektach, które stały u podstaw budowy takich koncepcji jak hurtownia danych, czyli bezpieczeństwo danych, ich zmienność w czasie. Nie
zrozumcie mnie źle, daleki jestem od kurczowego trzymania się koncepcji, które sprawdzały się lata temu przy jednoczesnym ignorowaniu nowoczesnego podejścia
do pracy z danymi. Jednocześnie bardzo daleko mi do budowania w oparciu o najnowsze koncepcje  uproszczonych i „zwinnych” bytów, które zyskują miano paradygmatu. W moim odczuciu jest to ewolucja, której nie da się uniknąć, ale jednocześnie bardzo dobry moment,aby korzystać z dojrzałych i sprawdzonych rozwiązań.
Zerknijmy jeszcze raz na najnowszą koncepcję i zastanówmy się czy przypadkiem w rzeczywistości nie będzie to wyglądało w ten sposób:

Źródło: https://www.linkedin.com/pulse/time-data-lakehouse-drazen-orescanin/

Bardzo ciekaw jestem Waszej opinii na ten temat, przede wszystkim, czy warto wprowadzać do naszego codziennego słownika nowe, niewiele znaczące nazwy koncepcji, czy może zwyczajnie warto rozmawiać o ewolucji, której niewątpliwie jesteśmy świadkami i czerpać korzyści z
rozwiązań, które pozwalają nam adresować tak mocno zmieniające się potrzeby biznesowe…

ZOSTAW ODPOWIEDŹ

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *