Oczekiwania w zakresie Business Intelligence najczęściej rozpoczynają się od potrzeby uzyskania kilku nieskomplikowanych raportów, analiz bądź pulpitów. Jednak, aby odpowiednio zaadresować takie potrzeby, należy zadać sobie pytanie, jakimi danymi źródłowymi dysponujemy, czy wymagają one przekształceń, dodatkowych przeliczeń, odpowiedniego ułożenia w struktury faktów, wymiarów.
Najprostszy przypadek, jaki można sobie wyobrazić to dane źródłowe w postaci pojedynczej tabeli, która zawiera wszystkie miary oraz atrybuty wg. których chcemy je analizować, do tego opisane w przyjaznej dla użytkowników końcowych formie. Taka sytuacja ma miejsce, gdy mówimy o systemie źródłowym, który udostępnia odpowiednio przygotowane dane i najlepiej, jeżeli jest zintegrowany z aplikacją BI, np. w postaci osadzonych obiektów analitycznych.
Jednak w rzeczywistym świecie okazuje się, że zarówno potrzeby biznesowe dot. raportów, analiz oraz kokpitów, jak i złożoność i dostępność danych źródłowych są znacznie bardziej skomplikowane. Często potrzeby biznesowe wymagają łączenia danych z różnych obszarów działalności, odpowiedniego przetwarzania tych danych, przeliczania, ułożenia w struktury wymiarów i faktów. Do tego dochodzi potrzeba łączenia danych z kilku lokalizacji, np. w przypadku przedsiębiorstw wielooddziałowych, międzynarodowych. W takich sytuacjach bardzo szybko pojawia się potrzeba zbudowania hurtowni danych.
Scenariusz 1.
Firma posiada dane źródłowe oraz hurtownię danych w swojej infrastrukturze lokalnej, natomiast do warstwy prezentacji danych chce wykorzystać usługi chmurowe Microsoft Power BI.
W takim przypadku z pomocą przychodzi lokalna brama danych (On-premises data gateway).
Lokalna brama danych pozwala na zestawienie pomostu między lokalną hurtownia danych a usługą chmurową Power BI. Pozwala ona na zestawienie połączenia do baz relacyjnych SQL lub modeli wielowymiarowych SQL Analysis Services, ale również do innych źródeł danych, np. plików, SharePoint.
Scenariusz 2.
Dane źródłowe znajdują się w systemach lokalnych, natomiast my chcemy zbudować hurtownię danych oraz warstwę prezentacji danych w oparciu o nowoczesne rozwiązania chmurowe Microsoft. Możemy wykorzystać ten sam mechanizm lokalnej bramy danych do połączenia do systemów źródłowych. Jednak do składowania i przetwarzania danych wykorzystamy komponenty w postaci usług chmurowych Microsoft.
Główne korzyści nowoczesnych hurtowni danych w chmurze:
Kluczowe usługi chmurowe Microsoft, użyte do stworzenia nowoczesnej hurtowni danych:
Przepływ danych w scenariuszu drugim:
Jeżeli mamy do czynienia wyłącznie z ustrukturyzowanymi danymi w postaci tabel, można pominąć Blob Storage i zastąpić go, przez usługę bazy danych. Taka struktura również sprawdzi się w sytuacji, kiedy jesteśmy firmą wielooddziałową, gdzie dane źródłowe znajdują się w wielu lokalizacjach. W takim przypadku wykorzystamy usługi Data Factory do obsłużenia procesów importu danych z poszczególnych lokalizacji do Data Lake.
Scenariusz 3.
Usługi chmurowe oferują bardzo szerokie możliwości wykorzystania gotowych komponentów do zbudowania potrzebnego rozwiązania. W tym scenariuszu wzbogacimy naszą hurtownię danych o mechanizmy uczenia maszynowego wykorzystując usługi Apache Spark.
Przepływ danych w scenariuszu trzecim:
Jak oceniasz przeczytaną treść?
Średnia ocena: 0 / 5. Ilość głosów: 0
Ten post nie został jeszcze oceniony. Bądź pierwszy!
Wiceprezes Zarządu
Jako Wiceprezes Zarządu, odpowiada za rozwój i wdrażanie systemów ERP, Business Intelligence oraz wsparcie i współpracę z kluczowymi Klientami. Jest ekspertem w zakresie zarządzania projektami wdrożeniowymi z ogromnym doświadczeniem w dziedzinach BI, ERP, CPM, CRM. Zwolennik „rozwiązań chmurowych” jako przyszłości dla branży IT.