Programování pro biology

Úvod do programování v Pythonu

Anastázie Sedláková
nasta[zavináč]sedlakovi.org

Anotace

Tento předmět nejprve seznámí studenty s algoritmickým stylem myšlení pomocí vytvoření programu ve vizuálním jazyce Scratch. Hlavní náplní předmětu bude úvod do programování v Pythonu. Studenti se seznámí s datovými typy, a naučí se psát funkce, cykly a podmínky v Pythonu. Částí kurzu bude také pochopení a tvorba výjimek a jejích důležitost v programování. Studenti se naučí sdílet svoji práci pomocí IPython notebooku a analyzovat data pomocí pandas s následnou vizulazací. Během celého předmětu budou studenti pracovat s verzovacím systémem Git, pomocí kterého budou ukládat výsledky své práce.

Kurz nevyžaduje předchozí znalost programování. V kurzu budou použity biologické příklady, které pomůžou studentům lépe pochopit strukturu jazyka Python a snadněji začít s programováním. Kurz bude ukončen zápočtem. Pro úspěšné absolvování kurzu je potřeba, aby studenti udělali projekt zpracování biologických dat, na němž budou pracovat během celého kurzu. Důraz bude kladen na naučení se algoritmického myšlení, což je obvykle nejproblematičtější oblast u studentů neinformatických oborů.

Python je velmi přivětivý a dobře čitelný jazyk, který má velkou a nestále rostoucí komunitu uživatelů také z řad biologů.

Cíl předmětu

Cílem předmětu je zbavení studentů strachu z programování a naučit je nejen příkazy pro zpracování dat, ale i způsoby, jak lze na problém podívat z pohledu algoritmického myšlení. Po úspěšném absolvování předmětu budou studenti schopni provádět analýzu dat jakýchkoliv dat v textovém formátu efektivněji a reproducibilně. Tento kurz může také poslouží studentům dobrým základem pro následné samostudium dalších nástrojů pro zpracování dat. Tento předmět je určen pro studenty, kteří nemají žádné základy programování, ale chtějí se naučit efektivní práci s daty.

Kdy a kde

Každé úterý 17:20 - 18:50, učebna B311, Viničná 7, 3. patro.

Sylabus

  1. Algoritmické myšlení. Přednáška
  2. Základy práce s příkazovým řádkem. Přednáška
  3. Tvorba programu v jazyce Scratch. Přednáška
  4. Verzovací systém Git. Přednáška
  5. Úvod do programování v Pythonu. Datové typy. Přednáška - Python vzorový .gitignore
  6. Datové typy - pokračování. Přednáška Zápisky z hodiny
  7. Podmínky a cykly. Přednáška Zápisky z hodiny
  8. Funkce. Přednáška
  9. Práce s textovými soubory - Pandas
  10. Práce s textovými soubory - pokračování
  11. Vizualizace dat - Plotly
  12. Interaktivní vizualizace - Dash

Seznam splněných domácích úkolů

Semestrální projekt

Užitečné odkazy

Markdown pro hezčí IPython Notebook. IPython notebook

Návod na vložení IPython Notebooku na GitHub.

Instalace

Pro kurz můžete používat Python 3.5 nebo 3.6, ale pozor, ne Python 2.

Windows

  1. Nainstalujte Anacondu3 4.4.0. 32-bitovou nebo 64-bitovou dle typu vašého počítače. Důležité: neinstalujte Anacondu3 5 - problémy s Git Bash!

Pandas už by měl být nainstalovaný.

Pokud ne, nainstalujte ho pomocí příkazu conda install pandas např. v GitBash.

Linux, MacOS

Instalace Pythonu 3 v Ubuntu:

sudo apt install python3 python3-pip

Instalace Pythonu 3 v MacOS:

brew install python3 Pozn. pokud nemáte brew, nainstalujte jej podle návodu na brew.sh.

Jakmile máte Python 3, můžete instalovat dále.

  1. Nainstalujte pandas pip3 install pandas

  2. Nainstalujte Jupyter Notebook pip3 install jupyter

Spuštění Jupyter Notebooku

Windows

Protože máte python nainstalovaný pomocí Anacondy, program na spuštění Jupyter notebooku by měl byt v podsložce Anaconda.

Linux, MacOS

Spustíte Jupyter Notebook pomocí příkazu jupyter notebook

Doporučená literatura

Software Carpentry: The UNIX Shell

Data Carpentry

Practical computing for biologists

Python for Biologists

Python course in bioinformatics

Illustrating Python via Bioinformatics Examples

Introduction to Programming using Python