Python je v současnosti nejpoužívanějším programovacím jazykem pro datovou analýzu. Existuje pro něj obrovské množství knihoven a nástrojů, které usnadňují každodenní práci s daty.
Na kurzu se naučíš, jak efektivně pracovat s daty pomocí knihovny pandas, jak v Pythonu vyčistit data od chyb nebo duplicit, spojovat datové soubory k sobě, agregovat je, provádět výpočty a vytvářet z nich grafy a srozumitelné výstupy.
Vyzkoušíš si datovou analýzu pomocí nástrojů umělé inteligence, což ti otevře nové možnosti pro hlubší a sofistikovanější pohled na data. Seznámíš se také s vizualizací dat, díky které budeš umět představit výsledky analýz srozumitelným způsobem.
Rozsah přímé výuky je 15 hodin. Pokud máš zájem získat certifikát, během kurzu budeš plnit úkoly, které ti dohromady zaberou zhruba 25 hodin nad rámec přímé výuky.
Tento kurz je součástí cesty Datová analytička.
Na konci kurzu:
- Dokážeš načíst data ze souboru do knihovny pandas,
- provádět základní operace s daty (filtrování, agregace, řazení, spojování),
- vytvářet vizualizace a s nimi prezentovat výsledky své práce,
- používat pivot tabulky, porovnávat různé řádky tabulky, pracovat s datem a časem.
Pro koho je kurz určený
- Pro ženy, které absolvovaly kurz Úvod do Pythonu,
- nebo mají základní znalosti odpovídající obsahu kurzu Úvod do Pythonu, konkrétně:
- umí napsat a spustit jednoduchý Python program, který bude obsahovat ukládání do proměnných, používání funkcí a podmínek.
Obsah kurzu
- Načtení dat s využitím knihovny pandas, jupyter notebooky
- Načtení dat z různých formátů (CSV, JSON)
- Práce v jupyter notebooku
- Filtrování dat a propojování tabulek
- Výběr dat na základě určitého kritéria (např. čištění a kontrola dat, výběr dat k další analýze)
- Propojení různých tabulek na základě společného sloupce (v SQL je to operace JOIN)
- Agregace, počítané sloupce, řazení, základy popisné statistiky
- Agregace (počítání průměrné hodnoty nebo součtu pro skupinu dat)
- Přidání nového sloupce počítaného z ostatních sloupců
- Průměr, medián, směrodatná odchylka, minimum, maximum
- Vizualizace s využitím knihovny seaborn
- Čárový graf, sloupcový graf, bodový graf, histogram, krabicový graf atd.
- Datum a čas, metoda shift, pivot tabulky
- Převod na datum a čas
- Výpočet rozdílu mezi dvěma daty a časy
- Posunutí řádku (v SQL jde o window function)
- Pivot tabulky (kontingenční tabulky) – vyhodnocení vztahu dvou sloupců
- Datová analýza s využitím AI nástrojů
- Datová analýza v ChatGPT, případně prostřednictvím jiných aktuálně využívaných nástrojů
Jak kurz zakončíš
Certifikát obdržíš, pokud:
- splníš úkoly,
- splníš docházku – zúčastníš se alespoň 5 ze 6 lekcí.
Související kurzy