BI & Data Science slovník

Níže je seřazený slovník nejběžnějších pojmů, které by měl každý BI & Data science specialista znát. (změna vyhrazena)

Pojmy jsou vysvětlovány v bodech v jejichž nejjednodušší možné formě. Pokud stojíte o rozsáhlejší informace, využijte prosím jiný informační portál.

Business Intelligence

  • Pojem se používá zhruba od roku 1958
  • Soubor činností pro podporu manažerského rozhodování -> Proces převedení zdrojových dat, úprava, transformace, nahrání do datového skladu, tvorba reportů, rozhodování

Data Science

  • Také známá jako věda o datech, nebo věda řízená daty, pojem se používá od roku 1960
  • Soubor činností pro získávání poznatků z dat v různých formách, buď strukturovaných nebo nestrukturovaných
  • Sjednocení statistik a analýz dat s cílem „pochopit a analyzovat skutečné jevy“ s daty

Datový sklad

  • Datový sklad, označován jako DWH, nebo Data Warehouse
  • Typ databáze, kam proudí data z různých zdrojových systémů
  • Schéma databáze je tvořeno z dimenzí a z faktových tabulek
  • Pro ukládání dat využívá technologii OLAP

ETL

  • Extract, transform, load
  • Proces extrakce, transformace a nahrání dat do datového skladu, datového tržiště
  • Po dokončení procesu jsou nahraná data využívána jako primární zdroj pro BI a další aplikace

OLAP

  • Online Analytical Processing
  • Technologie uložení dat v databázi, která umožňuje uspořádat velké objemy dat

OLAP kostka

  • Dvojrozměrně tabulkové uspořádání dat
  • Ukládá každou datovou dimenzi do jedné osy v kostce
  • Můžeme koukat na data z různých hledisek (např. sledovat počet objednávek v čase, kdy objednávka a čas jsou dvě různé dimenze)

R (programovací jazyk)

  • Programovací jazyk a prostředí určené pro statistickou analýzu dat
  • Je zdarma, Open Source, výkonný a vysoce rozšiřitelný

2 komentáře: „BI & Data Science slovník

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *