Kuo geresnę vizualizaciją pasirinksite duomenims, esantiems įprastose lentelėse, atvaizduoti, tuo lengviau bus tuos duomenis analizuoti ne tik jums, bet ir kolegoms, su kuriais dalinatės informacija, tuo greičiau ir paprasčiau bus galima pamatyti reikiamas įžvalgas ir priimti atitinkamus sprendimus. Apie tai, kaip mūsų smegenys priima informaciją ir kodėl duomenų vizualizavimas tampa toks svarbus, jau rašė ir mano kolegė (paskaityti galite čia).
Šiuolaikinėmis technologijomis sukurti grafiką užtenka vos keleto sekundžių – verslo duomenų analitikos įrankis Qlik Sense naudotojams pateikia platų duomenų vizualizavimo asortimentą, kuris vis pildomas, išeinant naujoms versijoms. Tampa svarbu mokėti ir žinoti, kaip pasirinkti tinkamiausią diagramą ar vizualizaciją savo duomenų informacijai atvaizduoti aiškiai ir suprantamai. Jei nesate tikri, kokią vizualizaciją kokiems duomenims naudoti, paskaitykite rekomendacijas, kurias sudėliosiu keliuose tekstuose. Šis pirmasis iš būsimo ciklo.
Viena iš populiariausių diagramų – Stulpelinė diagrama (angl. Bar chart), kuri yra naudojama, kai norima palyginti ir atvaizduoti dimensijos reikšmių skirtumus (pasirinkto rodiklio), pavyzdžiui, prekių, įmonių, amžiaus grupių, miestų. Šiam tikslui pasiekti puikiai tinka tiek vertikali, tiek horizontali stulpelinė diagrama. Šia diagrama pateiktus duomenis yra lengva suvokti, nes skirtumai pastebimi iškart:
1 pav. Vertikali stulpelinė diagrama
2 pav. Horizontali stulpelinė diagrama
Stulpelinė diagrama taip pat gali būti naudojama rodiklio reikšmių palyginimui laiko prasme, pvz., stebėti kaip kinta įmonės bendrasis pelnas kas mėnesį. Tačiau iš savo patirties galiu pasakyti, kad ši diagrama nėra tokia aiški, kai siekiama atvaizduoti rodiklio pokytį per tam tikrą laiko periodą (tam tikslui naudotina linijinė diagrama (angl. Line chart).
Tuo atveju, jei turite vieną rodiklį ir dvi dimensijas bei norite atvaizduoti, kaip vienos dimensijos reikšmės pasiskirsto pagal kitos dimensijos reikšmes, taip pat rinkitės vieną iš stulpelinės diagramos variantų. Pvz., kai norite atvaizduoti tų pačių prekių apyvartos rezultatus skirtingose parduotuvėse arba vyrų ir moterų vidutinius atlyginimus pagal amžiaus grupes, naudokite jungtinės stulpelinės diagramos tipą (angl. Clustered bar chart):
3 pav. Jungtinė stulpelinė diagrama
Stulpelinė diagrama turi dar vieną tipą – sudėtinė stulpelinė diagrama (angl. Stacked bar chart). Šio tipo diagrama dimensijos reikšmes sudeda į vieną stulpelį, o vertes susumuoja. Taigi, šis diagramos tipas leidžia analizuoti dimensijos reikšmių pasiskirstymą. Pvz., galime atvaizduoti jau ankščiau nagrinėtą atvejį: kaip atrodo prekių apyvarta skirtingose parduotuvėse. Taip pat, ši diagrama leidžia matyti ir bendrą apyvartą pagal parduotuves:
4 pav. Sudėtinė stulpelinė diagrama
Jungtinė stulpelinė ir sudėtinė stulpelinė diagramos gali būti naudojamos, kai norima atvaizduoti iki 15 rodiklių, naudojant tik vieną dimensiją. Praktikoje šį variantą naudoju gana retai, bet jis yra viena iš alternatyvų, kaip atvaizduoti susijusius rodiklius, pvz. apyvartą ir pardavimų grąžinimus pagal prekes.
Naudojantis Qlik Sense, nesudėtinga pastebėti, kad šis įrankis stulpelinei diagramai suteikia daug papildomo funkcionalumo. Viena naudingiausių funkcijų, mano manymu, yra ta, jog galime naudoti alternatyvias dimensijas ir rodiklius, t.y. Qlik Sense naudotojas, analizuodamas duomenis stulpelinės diagramos dėka, gali vienu paspaudimu perjungti rodiklį ar dimensiją. Pvz., ta pati diagrama gali atvaizduoti įmonės bendrąjį pelną, apyvartą, darbuotojų skaičių kas metus, kas mėnesį ar kiekvieną dieną. Toks funkcionalumas suteikia naudotojui platesnes galimybes analizuoti duomenis, ir, žinoma, sutaupo vietos analizės lange.
Žemiau rasite dar keletą apibendrintų patarimų apie stulpelinę diagramą:
- Siekiant, kad informacija būtų suvokiama greičiau ir palyginama lengviau, patartina duomenis išrikiuoti didėjimo arba mažėjimo tvarka, o ne abėcėlės tvarka.
- Visada y ašį pradėkite nuo 0, – priešingu atveju, jūsų duomenų įžvalgos gali būti klaidingai suprantamos (kaip daugiau ar mažiau reikšmingos, nei iš tikrųjų yra).
- Esant dideliam dimensijų reikšmių kiekiui, šios gali netilpti į vieną diagramos langą ir teks naudoti slinkties juostą norint pamatyti visas reikšmes. Tokiu atveju rekomenduoju naudoti horizontalią stulpelinę diagramą vietoj vertikalios, – taip bus lengviau suprasti duomenis.
- Stenkitės naudoti vieną spalvą ar atspalvį, – per didelės spalvų variacijos gali atitraukti dėmesį nuo gautų rezultatų.
- Nepamirškite naudoti diagramos pavadinimo ir antraštės, – tai suteiks vartotojui naudingos informacijos. Pavadinimai ir antraštės turi būti aiškios, konkrečios ir suprantamos.
- Jei naudojate daugiau negu vieną dimensiją, – nepamirškite naudoti ir legendą.
2019 m. balandžio mėnesį buvo paskelbtas Qlik Sense atnaujinimų paketas, kuris pateikė nemažai naujienų. Vienas iš atnaujinimų – stulpelinė/ploto diagrama (angl. Bar&Area chart), kuri gali būti naudojama palyginimui ir dimensijos reikšmių skirtumams atvaizduoti. Ši nauja diagrama turi dalį stulpelinės diagramos funkcionalumo, tačiau yra papildyta naujomis funkcijomis, kurios leidžia patogiau analizuoti pokyčius. Vienas iš didžiausių naujos diagramos privalumų: užvedus žymeklį ties kraštinėmis parodomas skirtumas tarp reikšmių – šis funkcionalumas labai naudingas duomenų analizės metu. Pvz., žemiau pateiktoje diagramoje iškart matomas „Parduotuvės 4“ apyvartos padidėjimas 2018 m., lyginat su 2017 m.:
5 pav. Stulpelinė/ploto diagrama
Kitas privalumas – galimybė nurodyti rodiklio reikšmes arba dimensijos pavadinimus atitinkamuose stulpeliuose. Taip pat Qlik Sense suteikia galimybę pasirinkti šriftą, teksto spalvą ir dydį – ankščiau tokio tipo grafikuose šio funkcionalumo nebuvo.
Stulpelinėje/ploto diagramoje priklausomai nuo to, ką norite atvaizduoti, galite pasirinkti iki 5 rodiklių (be jokios dimensijos), 1 dimensiją ir iki 5 rodiklių, 2 dimensijas ir 1 rodiklį. Visa tai suteikia dar didesnes atvaizdavimo galimybes.
Kita dažnai naudojama diagrama – Linijinė diagrama (angl. Line chart), kuri taikoma rodiklio tendencijoms laiko atžvilgiu arba tam tikra tvarka išsidėsčiusioms dimensijos reikmėms atvaizduoti. Iš savo patirties galiu teigti, kad tik labai retais atvejais linijinė diagrama yra naudojama rodiklio reikšmių atvaizdavimui pagal ne kalendorines dimensijas. Man asmeniškai linijinė diagrama yra nepakeičiama, kuomet norisi vizualizuoti rodiklio pokyčius laiko atžvilgiu, analizuoti tendencijas. Pvz., analizuoti įmonės apyvartą ir bendrąjį pelną per tam tikrą laikotarpį.
Vienas iš Qlik Sense linijinės diagramos privalumų – galimybė duomenų atvaizdavimui naudoti net dvi dimensijas ir vieną rodiklį arba vieną dimensiją ir iki 15 rodiklių. Pirmasis variantas, t.y. dviejų dimensijų naudojimas, yra ypač patogus, kuomet norima palyginti rodiklio reikšmes pagal dvi dimensijas, pavyzdžiui, ne tik pagal metus, bet ir pagal metų mėnesį. Žemiau pateiktame pavyzdyje gauname atsakymą apie apyvartos tendencijas, taip pat galime iš karto palyginti mėnesines apyvartas su prieš tai buvusių metų tais pačiais mėnesiais ir daryti išvadas:
6 pav. Linijinė diagrama su dviem dimensijomis ir vienu rodikliu
Naudojant vieną dimensiją ir kelis rodiklius, linijinės diagramos dėka galima atsakyti į tokius klausimus, kaip susijusių rodiklių tendencijos, vieno rodiklio įtaka kitam rodikliui ir pan. Pvz., žemiau pateiktame pavyzdyje matyti, kokią įtaką pardavimų rezultatams turi suteikiamos nuolaidos:
7 pav. Linijinė diagrama su viena dimensija ir 3 rodikliais
Dar vienas Qlik Sense linijinės diagramos privalumas – alternatyvių dimensijų ir rodiklių naudojimas, kaip ir stulpelinėje diagramoje. Nepriklausomai nuo pasirinktų rodiklių ir dimensijų skaičiaus, galite ir toliau naudoti alternatyvius pasirinkimus. Kaip ir stulpelinėje diagramoje, šis funkcionalumas suteikia platesnes galimybes naudotojui bei taupo vietą analizės lange.
Qlik Sense linijinė diagrama turi du atvaizdavimo tipus: linijinė (angl. line) ir plokštuminė (angl. area). Pirmuoju atveju vienas rodiklis yra atvaizduojamas kaip linija (pvz.: 7 pav.), o antruoju – visas plotas yra nuspalvinamas (pvz.: 6 pav.). Tiek vienu, tiek kitu atveju galima rodyti reikšmių taškus taškais arba pateikiant pačias reikšmių vertes. Jei diagramoje duomenų nėra daug, visuomet rekomenduoju rodyti rodiklio reikšmės vertes – tai yra labai patogu naudotojui.
Žemiau rasite dar keletą apibendrintų patarimų apie linijinę diagramą:
- Nors ir nėra jokios griežtos taisyklės, tačiau y ašį pradėkite nuo 0, kaip ir stulpelinėje diagramoje. Jei nesate aiškiai parodę, jog y ašis prasideda ne nuo nulio, dauguma naudotojų manys, kad pradedama skaičiuoti nuo nulio ir, tokiu atveju, rezultatų interpretavimas gali būti klaidingas.
- Rekomenduoju pasirinkti ne daugiau nei tris ar keturis rodiklius vienoje diagramoje, nes pernelyg „apkrauta“ diagrama gali atrodyti chaotiškai ir būti nesuprantama.
- Esant dideliam dimensijų reikšmių kiekiui, šios gali netilpti į vieną diagramos langą ir teks naudoti slinkties juostą norint pamatyti visas reikšmes. Tokiu atveju rekomenduoju nustatyti, kad grafikas visuomet rodytų vėliausius duomenis – tai dar viena puiki Qlik Sense funkcija (angl. scroll alignment).
- Jei naudojate daugiau negu vieną rodiklį, nepamirškite naudoti ir legendą.
- Ašys turi turėti pavadinimus, kad naudotojui nekiltų papildomų klausimų.
- Nepamirškite naudoti diagramos pavadinimo ir antraštės, – tai suteiks naudotojui naudingos informacijos. Pavadinimai ir antraštės turi būti aiškios, konkrečios ir suprantamos.
Ką daryti tais atvejais, kai norime palyginti ir analizuoti rodiklius, turinčius du skirtingus matavimo vienetus, pvz., apyvartos, bendrojo pelno ir maržos (%) rezultatus? Šiuo atveju nei stulpelinė diagrama, nei linijinė diagrama nėra tinkamos, nes rodikliai turintys didesnes vertes bus atvaizduojami įprastai, o atvaizduojantys mažesnes bus beveik nematomi dėl labai didelių skirtumų tarp rodiklių verčių. Norėdami palyginti ar analizuoti kelių rodiklių su dviem skirtingais matavimo vienetais tendencijas, galime naudoti Kombinuotą diagramą (angl. Combo chart). Šioje diagramoje skirtingi rodikliai atvaizduojami skirtingose y ašyse ir gali būti vaizduojami kaip stulpeliai, linijos ar simboliai:
Ši diagrama ne veltui yra vadinama kombinuota, – ji yra stulpelinės diagramos ir linijinės diagramos junginys. Kombinuota diagrama „paveldėjo“ stulpelinės ir linijinės diagramos privalumus. Tačiau verta atkreipti dėmesį į tai, kad kombinuota diagrama, kaip ir kitos dvi diagramos, turi trūkumą: naudojant daugiau negu du rodiklius, galime naudoti tik vieną dimensiją, tad diagramos turi ribotas galimybes, kai norima palyginti daugiau dimensijų. Naudojant kombinuotą diagramą, rekomenduoju atkreipti dėmesį į rekomendacijas skirtas stulpelinei ir linijinei diagramai.
***
Rekomenduoju paskaityti duomenų vizualizacijos specialistams:
Third Pillar Of Mapping Data To Visualizations: Usage
When to use what type of visualization
Viktorija Drazdovienė, Day Q verslo analitikė