Python je v současnosti nejpoužívanějším programovacím jazykem pro datovou analýzu. Existuje pro něj obrovské množství knihoven a nástrojů, které usnadňují každodenní práci s daty.
Na kurzu se naučíš, jak efektivně pracovat s daty pomocí knihovny pandas, jak v Pythonu vyčistit data od chyb nebo duplicit, spojovat datové soubory k sobě, agregovat je, provádět výpočty a vytvářet z nich grafy a srozumitelné výstupy.
Vyzkoušíš si datovou analýzu pomocí nástrojů umělé inteligence, což ti otevře nové možnosti pro hlubší a sofistikovanější pohled na data. Seznámíš se také s vizualizací dat, díky které budeš umět představit výsledky analýz srozumitelným způsobem.
Rozsah přímé výuky je 15 hodin. Během kurzu budeš procvičovat látku na úkolech, které ti dohromady zaberou zhruba 25 hodin nad rámec přímé výuky.
Tento kurz je součástí cesty Datová analytička.
Pro koho je kurz určený
- Pro ženy, které absolvovaly kurz Úvod do Pythonu,
- nebo mají základní znalosti jazyka Python, konkrétně:
- umí napsat a spustit jednoduchý Python program, který obsahuje ukládání do proměnných; používat funkce a podmínky.
Co budeš na konci kurzu umět
- Dokážeš načíst data ze souboru do knihovny pandas,
- provádět základní operace s daty (filtrování, agregace, řazení, spojování),
- vytvářet vizualizace a s nimi prezentovat výsledky své práce,
- používat pivot tabulky, porovnávat různé řádky tabulky, pracovat s datem a časem.
Obsah kurzu
- Načtení dat s využitím knihovny pandas, jupyter notebooky
- Načtení dat z různých formátů (CSV, JSON)
- Práce v jupyter notebooku
- Filtrování dat a propojování tabulek
- Výběr dat na základě určitého kritéria (např. čištění a kontrola dat, výběr dat k další analýze)
- Propojení různých tabulek na základě společného sloupce (v SQL je to operace JOIN)
- Agregace, počítané sloupce, řazení, základy popisné statistiky
- Agregace (počítání průměrné hodnoty nebo součtu pro skupinu dat)
- Přidání nového sloupce počítaného z ostatních sloupců
- Průměr, medián, směrodatná odchylka, minimum, maximum
- Vizualizace s využitím knihovny seaborn
- Čárový graf, sloupcový graf, bodový graf, histogram, krabicový graf atd.
- Datum a čas, metoda shift, pivot tabulky
- Převod na datum a čas
- Výpočet rozdílu mezi dvěma daty a časy
- Posunutí řádku (v SQL jde o window function)
- Pivot tabulky (kontingenční tabulky) – vyhodnocení vztahu dvou sloupců
- Datová analýza s využitím AI nástrojů
- Datová analýza v ChatGPT, případně prostřednictvím jiných aktuálně využívaných nástrojů
Příprava před kurzem
Jak kurz zakončíš
Certifikát obdržíš, pokud:
- splníš docházku – zúčastníš se alespoň 5 ze 6 lekcí,
- splníš domácí úkoly.
Související kurzy