KLASTER FIRM INFORMATYCZNYCH
POLSKI WSCHODNIEJ

Hurtownie danych

Hurtownia Danych jako baza danych systemu klasy Business Intelligence

Podstawową różnicą pomiędzy bazą danych a hurtownią danych jest rodzaj systemu informatycznego, który te dane wykorzystuje.  Hurtownia Danych (ang. Data Warehouse) służy do przechowywania danych, które następnie przetwarza i raportuje system klasy Business Intelligence.  Hurtownią Danych można więc określić „specjalnie zaprojektowaną i utrzymywaną dużą bazę danych, która przechowuje dane do celów działania systemu klasy Business Intelligence”.

 

Różnic pomiędzy bazami danych a Hurtowniami Danych jest wiele.  Po pierwsze, hurtownia danych podlega innym mechanizmom importu danych niż baza danych.  Baza danych odwzorowuje model danych w każdym czasie funkcjonowania systemu (np. ERP).  Hurtownię danych zasila się danymi pochodzącymi z różnych baz danych w przedsiębiorstwie, poza tym przechowuje ona dane historyczne.  Ze względu na to że dane te, pochodzące z różnych systemów są często sprzeczne (np. adres klienta), zanim zaimportuje się dane do hurtowni, należy usunąć te sprzeczności.  Kolejnym problemem są brakujące wartości (NULL), które uniemożliwiają tworzenie pełnych statystyk.  W takiej sytuacji często brakujące wartości są wypełniane, lub rekordy je zawierające są ignorowane.

 

Aby narzędzie (aplikacja, system) Business Intelligence działało sprawnie, Hurtownia Danych przechowuje dane zagregowane, zawierające także statystyki na danych kolumnach i rekordach.  Tworzy się nawet, analogicznie do bazodanowych tabel, struktury wielowymiarowe – np. kostki OLAP.  Osobną kwestią jest przechowywanie danych w Hurtowni Danych.  Często standardowe mechanizmy kopii zapasowej bazy danych (typu replikacja plus backup) nie wystarczają do zapewnienia ciągłości pracy hurtowni.  Dlatego zwykle stosuje się różne generacje macierzy RAID (ang. Redundant Array of Independent Disks), które w niektórych przypadkach zapewniają pełną bezawaryjność i brak ryzyka utraty danych.  Ponadto rozmiar pamięci niezbędny do poprawnego funkcjonowania Hurtowni Danych jest nieporównywalnie większy niż dla typowej bazy danych, w której często informacje historyczne podlegają archiwizacji.  Dlatego poprawne zaprojektowanie modelu danych Hurtowni Danych jest rzeczą krytycznie ważną i ma znaczący wpływ na działanie systemu Business Intelligence.

 

Hurtownia Danych jednolitym zbiorem krytycznych informacji o przedsiębiorstwie


Hurtownia Danych wykorzystuje dane będące w posiadaniu przedsiębiorstwa (np. bazę danych systemu CRM) ale też dane zewnętrzne.  Dlatego również krytycznie ważnym krokiem jest poprawne zaimplementowanie systemu ETL czyli zasilania hurtowni danych.  System ETL powinien usuwać wieloznaczności (np. odmienny adres kontrahenta w dwóch bazach danych), standaryzując dane na poziomie hurtowni (mechanizm ten określa się mianem „jedna wersja prawdy”).  Niezależnie, importując dane z systemów zewnętrznych (np. usługi webowe, ang. Web Services) należy zadbać aby nie naruszyły poprawności i integralności danych obecnych w hurtowni.

 

W przypadku wdrażania rozwiązań klasy Business Intelligence czy budowania Hurtowni Danych, na rynku występują gotowe rozwiązania zagranicznych firm.  Ze względu na swój stopień zaawansowania, są to jednak rozwiązania dedykowane dla dużych przedsiębiorstw z wybranych sektorów (finanse, telekomunikacja).  Co ważne, tak jak w przypadku gotowych systemów ERP, często czas poświęcony na dopasowanie gotowego systemu pod konkretne przedsiębiorstwo, rozumiany zarówno jako całkowity czas wdrożenia jak i godziny pracy konsultantów, dodatkowo powiększają ten koszt.  Dlatego warto także rozważyć wdrożenie rozwiązań własnych, wytworzonych w polskich firmach informatycznych ponieważ zarówno koszt rozwiązań jak i czas wdrożenia powodują, że rozwiązania te stają się dostępne praktycznie dla podmiotów dowolnej wielkości.

 

Podsumowując, projektowanie, modelowanie, implementacja oraz utrzymanie Hurtowni Danych stanowi obecnie jedno z trudniejszych zagadnień informatycznych, wymaga bowiem wiedzy oraz wieloletniego doświadczenia.  Dlatego projektowanie Hurtowni Danych oraz projektowanie i wdrażanie systemów klasy Business Intelligence oferowane jest na rynku przez wąską grupę wyspecjalizowanych w tej dziedzinie podmiotów.

 

Realizacja: Ideo, Powered by: CMS Edito
Wszelkie prawa zastrzeżone KlasterIT - Klaster Firm Informatycznych Polski Wschodniej | ul. Hanasiewicza 19, pok. 12, Rzeszów, Podkarpacie
Projekt współfinansowany ze środków Unii Europejskiej w ramach Programu Operacyjnego Rozwój Polski Wschodniej 2007-2013