BI & Data Science slovník

Níže je seřazený slovník nejběžnějších pojmů, které by měl každý BI & Data science specialista znát. (změna vyhrazena)

Pojmy jsou vysvětlovány v bodech v jejichž nejjednodušší možné formě. Pokud stojíte o rozsáhlejší informace, využijte prosím jiný informační portál.

Business Intelligence

 • Pojem se používá zhruba od roku 1958
 • Soubor činností pro podporu manažerského rozhodování -> Proces převedení zdrojových dat, úprava, transformace, nahrání do datového skladu, tvorba reportů, rozhodování

Data Science

 • Také známá jako věda o datech, nebo věda řízená daty, pojem se používá od roku 1960
 • Soubor činností pro získávání poznatků z dat v různých formách, buď strukturovaných nebo nestrukturovaných
 • Sjednocení statistik a analýz dat s cílem „pochopit a analyzovat skutečné jevy“ s daty

Datový sklad

 • Datový sklad, označován jako DWH, nebo Data Warehouse
 • Typ databáze, kam proudí data z různých zdrojových systémů
 • Schéma databáze je tvořeno z dimenzí a z faktových tabulek
 • Pro ukládání dat využívá technologii OLAP

ETL

 • Extract, transform, load
 • Proces extrakce, transformace a nahrání dat do datového skladu, datového tržiště
 • Po dokončení procesu jsou nahraná data využívána jako primární zdroj pro BI a další aplikace

OLAP

 • Online Analytical Processing
 • Technologie uložení dat v databázi, která umožňuje uspořádat velké objemy dat

OLAP kostka

 • Dvojrozměrně tabulkové uspořádání dat
 • Ukládá každou datovou dimenzi do jedné osy v kostce
 • Můžeme koukat na data z různých hledisek (např. sledovat počet objednávek v čase, kdy objednávka a čas jsou dvě různé dimenze)

R (programovací jazyk)

 • Programovací jazyk a prostředí určené pro statistickou analýzu dat
 • Je zdarma, Open Source, výkonný a vysoce rozšiřitelný

2 komentáře: „BI & Data Science slovník

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *