Analiza danych w Power BI – jak wybrać odpowiedni sposób prezentacji danych?

Autor: Sebastian Kruca, Konsultant Business Intelligence

Wybór skutecznego wykresu 

W świecie, w którym stale rośnie ilość danych, umiejętność przedstawiania historii  przy ich użycia jest bardzo istotna z perspektywy rozwoju organizacji. Rozwój technologiczny korzystnie wpływa na dostęp do narzędzi pozwalających opracowywać dane, wzrasta również biegłość w posługiwaniu się oprogramowaniem tego typu. Wciąż jednak pojawiają się problemy z niewystarczającymi umiejętnościami do wykorzystania potencjału tych narzędzi.  

Dla wielu osób wrzucenie danych oraz wygenerowanie wykresu (np. w Excelu) jest równoznaczne z końcem procesu wizualizacji danych. Takie postępowanie może spowodować, że nawet najbardziej interesująca historia stanie się mało klarowna lub całkowicie niezrozumiała. Dane skrywają pewną opowieść, którą analityk lub osoba przekazująca informacje ma za zadanie ożywić odwołując się do warstwy wizualnej. 

Najczęściej materiał, który przygotowujemy powstaje na zamówienie kogoś innego: klienta, interesariusza lub Twojego przełożonego. Oznacza to, że nie znamy pełnego kontekstu, który z pozoru może wydawać się oczywisty dla innej osoby. Zanim zaczniemy cokolwiek przygotowywać warto zadać kilka pytań, które rozwieją ewentualne wątpliwości, np.: 

  • Jakie informacje dotyczące zarysu sytuacji są istotne lub niezbędne? 
  • Kim jest publiczność lub osoba podejmujące decyzje? Co wiemy o tych osobach? 
  • Jak przedstawiają się uprzedzenia naszych odbiorców, które mogłyby wywołać ich przychylność wobec naszego przesłania lub wzbudzić w nich opór w stosunku do tego komunikatu? 
  • Jakimi danymi możemy poprzeć nasze stanowisko? Czy nasza publiczność zna te informacje, czy może będą one dla tych osób nowe? 
  • Jak przedstawia się ryzyko: które czynniki mogą obniżyć wiarygodność naszych ustaleń? Czy musimy podjąć działania zapobiegawcze pozwalające zająć się tymi kwestiami? 
  • Jaki wynik zostanie przez nas uznany za sukces? 
  • Jak wyglądałaby nasza wypowiedź, gdyby okazało się, że na nasze przekazanie odbiorcom tego, co powinni wiedzieć, mamy bardzo mało czasu lub musimy się zmieścić w jednym zdaniu? 

Istnieje wiele różnych diagramów oraz sposobów wizualnego przedstawiania informacji, jednak dla większości naszych potrzeb wystarcza zaledwie kilka z nich. Poniżej zaprezentowane zostanie kilka spośród możliwych do wykorzystania. 

Prosty tekst

Gdy masz do zakomunikowania zaledwie jedną lub dwie liczby, warto rozważyć użycie cyfr jako środka przekazu oraz kilku słów uzupełnienia, dzięki temu w sposób zrozumiały przedstawisz swoje przesłanie. Wykorzystanie tabeli lub wykresu w tym wypadku może być mylące, a także sprawi, że liczby mogą utracić część swego na swojej istotności. 

 

Tabele

Tabele świetnie nadają się do przekazywania informacji różnorodnej publiczności, złożonej z osób, które samodzielnie poszukują konkretnych rzeczy budzących ich zainteresowanie. Gdy mamy przed sobą tabelę, zazwyczaj wodzimy po niej palcem wskazującym i czytamy wartości znajdujące się w kolumnach i wierszach oraz porównujemy liczby. W przypadku prowadzenia prelekcji nie jest to najlepsze narzędzie, ponieważ publiczność zaczyna czytać zawarte w niej informacje i przestaje się skupiać na tym co jest przekazywane werbalnie. Przygotowując tabelę ważne jest, by na pierwszy plan wysunęły się dane, a krawędzie w jak najmniejszym stopniu angażowały uwagę odbiorcy.

blank 

 

Mapa cieplna 

Jednym z rozwiązań, które pozwalają połączyć tabelę ze wskazówkami wizualnymi, jest mapa cieplna.  Wykorzystanie tego typu wykresu polega na zwizualizowaniu danych w postaci tabeli, gdzie w miejscu liczb (lub oprócz nich) wykorzystuję się barwne komórki pokazujące ich względną wielkość. 

W poniższym przykładzie w tabeli ciężko na pierwszy rzut oka stwierdzić, które wartości są najwyższe lub najniższe. Aby ograniczyć do minimum wysiłek intelektualny, możemy użyć nasycenia koloru, co ułatwi ocenę tego co dla nas potencjalnie interesujące. 

blank

 

Wykres punktowy 

Wykresy punktowe mogą być dobrym rozwiązaniem w przypadku, gdy chcemy zaprezentować zależność między dwiema zmiennymi, ponieważ potrafią przedstawiać dane równocześnie na osi poziomej i pionowej. W tej sytuacji można sprawdzić, czy zachodzi zależność między nimi. Tego typu wykresy są najczęściej wykorzystywane w świecie nauki, sporadycznie mogą być zastosowane w realiach biznesowych. 

Przypuśćmy, że zarządzamy sprzedażą produktu w hurtowni i chcemy zrozumieć zależność między liczbą sprzedanych produktów w jednym zamówieniu a marżą przypadającą na jednostkę produktu. Na tej podstawie moglibyśmy określić, czy aktualna cena produktu jest odpowiednia. 

blank

 

Gdybyśmy chcieli się skupić przede wszystkim na przypadkach, w których marża była wyższa od średniej, można zmodyfikować diagram, by ta kwestia skupiła wzrok odbiorcy. 

blank

Możemy użyć tego wykresu, by wykazać, że wielkość zamówienia nie wpływa znacząco na marże jednostkową. Natomiast w sytuacji, gdy marża przekraczała wartość 14,71 zł za pojedynczy produkt, liczba transakcji znacznie spada, a zatem najprawdopodobniej należałoby ustalić aktualną cenę produktu tak, by marża nie przekraczała aktualnej wartości średniej.  

Wykres liniowy 

Wykresy liniowe stosowane są w przypadku prezentowania danych ciągłych. Linia łącząca punkty, implikuje więź, co mogłoby nie mieć sensu np. w przypadku danych kategorycznych. Nasze dane najczęściej ujęte są w jakiejś jednostce czasu: dniach, miesiącach, kwartałach lub latach. Mogą przedstawiać pojedynczą lub wiele serii danych. 

blank

Ważne, aby zachowana została spójność upływu czasu na osi. Sytuacja, w której taka sama odległość między punktami na części osi prezentowana jest w dekadach a następnie w odstępach rocznych, może wprowadzać w błąd. 

W przypadku, gdy mamy dwa okresy do porównania i chcemy zaprezentować względne spadki i wzrosty w kilku kategoriach, możliwe jest użycie wykresu slopengraph. Jednak to, czy on się sprawdzi w określonej sytuacji zależy od samych danych. Duża liczba przecięć może sprawić, że wykres będzie nieczytelny. Warto również rozważyć podkreślenie wartości, które odbiegają od ogólnego trendu. 

blank

 

Wykres kolumnowy 

Wykresy kolumnowe, podobnie jak liniowe, mogą zostać zaprezentowane w jednej lub kilku seriach danych. Zauważalne jest jednak, że wraz z wzrostem liczby serii coraz trudniej jest skupić się na jednej z nich i wyciągnąć wnioski, dlatego należy je stosować z rozwagą.  

blank

Należy wziąć pod uwagę, że odstępy, które występują w wykresach kolumnowych, powodują efekt wizualnego grupowania. W tej sytuacji należy zachować względny porządek klasyfikacji. 

Dużo rzadziej używany jest skumulowany wykres kolumnowy. Ma on za zadanie umożliwić porównanie sum w różnych kategoriach przy jednoczesnej prezentacji jej składowych. Należy wziąć pod uwagę, że może to być bardzo przytłaczające pod względem wizualnym. Porównywanie składników należących do różnych kategorii staje się trudne, kiedy wychodzimy poza segmenty tworzące podstawę kolumn, ponieważ nie dysponujemy spójnym punktem odniesienia. Taki wykres może zwierać zarówno wartości absolutne lub każda kolumna może skumulować do 100%, zależy to od tego, co chcemy zakomunikować. 

blank

Wykres wodospadowy 

Ta odmiana wykresu  może być wykorzystywana w celu oddzielenia od siebie segmentów skumulowanego wykresu kolumnowego, co ułatwia w skupieniu się kolejno na każdym z nich. Można go również wykorzystać w sytuacji, gdy chcemy prześledzić punkt wyjścia, wzrosty bądź spadki, a także punkt końcowy będący efektem tych zmian. 

W poniższym przykładzie możemy przeanalizować w jaki sposób zmieniła się liczba pracowników w roku 2014. Możemy również sprawdzić w jaki sposób transfery wewnętrzne i zewnętrzne wpłynęły na wynik. 

blank

Wykres słupkowy 

Ten wybór rodzaju wykresu jest jednym z najlepszych w przypadku danych kategorycznych. Stanowi on odmianę wykresu kolumnowego odwróconą o 90°. Jest on niezwykle łatwy do odczytu. Struktura tego wykresu powoduje, że najpierw odczytujemy kategorie, a następnie dane. Pozwala to na ich szybką interpretację, co prezentuje poniższy przykład. 

blank

Znacznie łatwiej jest odczytać dane z wykresu słupkowego niż np. wykresu kołowego, w przypadku którego odczytywanie danych bez dodatkowych etykiet  oraz legendy staje się prawie niemożliwe. Kolejną przewagą jest możliwość szybkiego zorientowania się w hierarchii wartości poszczególnych segmentów. Na wykresie słupkowym z łatwością możemy ocenić która wartość jest najwyższa, a które kolejne w hierarchii. W przypadku zbliżonych wartości odczytanie poprawnej kolejności staje się prawie niewykonalne na wykresach kołowych. 

Skumulowany wykres słupkowy 

Podobnie jak w przypadku skumulowanego wykresu kolumnowego, wersja słupkowa może być wykorzystywana do zaprezentowania sum w różnych kategoriach przy jednoczesnym pokazaniu wartości elementów składowych. Można je również uporządkować w taki sposób, by przedstawiać wartości absolutne lub sumę równą 100%. 

blank

Częstym przypadkiem, w którym wykorzystywany jest ten wykres, są wyniki badań ankietowych. Szczególnie w prezentowaniu wyników w skali Likerta, tj. w skali od „zdecydowanie nie” po „zdecydowane tak”. 

Powierzchnia 

Ludzkie oko nie radzi sobie najlepiej z przypisaniem dwuwymiarowej przestrzeni wartości ilościowych, przez co wykresy powierzchniowe mogą być trudne w interpretacji. Warto po nie sięgnąć w przypadku, gdy mamy skrajnie zróżnicowane wielkości. Pozwala to w bardziej wyrazisty sposób wskazać różnicę wielkości między badanymi kategoriami. 

blank

Czego powinniśmy unikać podczas tworzenia wykresów? 

Przy okazji wykresu słupkowego wskazaliśmy wykresy kołowe jako trudne do interpretacji. Z dokładnie tego samego powodu powinniśmy unikać również wykresów pierścieniowych. Do użycia tego rodzaju wykresów powinniśmy się ograniczyć tylko w przypadku, gdy możemy w łatwy sposób zinterpretować hierarchię. Na poniższych wykresach bardzo trudno byłoby ustalić który łuk jest największy bez wpisania etykiet. 

blank

Nie należy również używać trzeciego wymiaru. Wprowadza to niepotrzebne elementy, takie jak powierzchnie boczne i dolne, które odwracają uwagę odbiorcy. Sposób, w który trzeci wymiar przedstawiany jest na osiach wykresów, często wprowadza w błąd. Na poniższym wykresie wartości stycznia i lutego wynosiły 1 podczas gdy wykres sugeruje, że jest to wartość niższa.  

blank

Druga oś y również nie jest najlepszą praktyką. Tworzy to często problemy z prawidłową interpretacją, która część wykresu odnosi się do konkretnej osi. Jeżeli wykorzystujemy wykres słupkowo-liniowy, lepiej zastosować etykiety, jednocześnie rezygnując z obu osi y.  

blank

Podsumowanie 

Powyższe przykłady są rodzajami wykresów, z których korzysta się najczęściej w organizacjach. Bez wątpienia będą zdarzały się przypadki użycia innych diagramów, jednak omówione warianty powinny wystarczyć do uporania się z większością spotykanych wyzwań w codziennej pracy. Ponadto, często mogą zdarzyć się sytuacje, w których „właściwym” wyborem może być kilka rodzajów wykresów. W takim przypadku najlepiej odwołać się do pytań z początku artykułu i ustalić, co chcemy przekazać naszej publiczności i która metoda będzie najodpowiedniejsza. W momencie, gdy mamy problem z ustaleniem który rodzaj wykresu będzie najlepszym wyborem, odpowiedź zawsze jest taka sama – ten, który będzie najłatwiejszy do odczytania przez naszych odbiorców. 

Źródło: Cole Nussbaumer Knaflic, „Storytelling danych poradnik dla profesjonalistów 

 

 

 

Jak oceniasz przeczytaną treść?

Średnia ocena: 5 / 5. Ilość głosów: 1

Ten post nie został jeszcze oceniony. Bądź pierwszy!

Wdrożenie systemu klasy premium

blank



Privacy Preference Center

Necessary

Podmioty, z których rozwiązań korzystamy to: GetResponse, GetSiteControl, Quform, RateMyPost.
Dysponują one własnymi, jasno zdefiniowanymi politykami prywatności, które stanowią zarazem kodeks postępowania gwarantujący należytą dbałość o przetwarzanie danych.

GetResponse, Quform, RateMyPost

Advertising

Zbieranie ciasteczek, umożliwiających dostarczanie użytkownikom treści reklamowych bardziej dostosowanych do ich zainteresowań.

Google Analytics, Google ADS

Analytics

Zebrane dane służą do monitorowania i sprawdzenia, w jaki sposób użytkownicy korzystają z naszych witryn, aby usprawniać funkcjonowanie serwisu zapewniając bardziej efektywną i bezproblemową nawigację.

Yandex Metrix, Google Anaytics

Other