Lékařská fakulta Masarykovy univerzity

 

Aktualizace: 6. 10. 2017 8:41:59
Garant obsahu:
Tomáš Navrátil
Kompletní informace infoimage
Stránka číslo: 1482
Přístupů: 3307
Vytvořeno: 2. 2. 2015 12:19:19

Pokročilé metody analýzy dat v neurovědách - DSAN02

Cíle předmětu

Cílem předmětu je prohloubit teoretické a praktické znalosti analýzy dat jednotlivých studentů o pochopení a osvojení principů pokročilých vícerozměrných metod analýzy dat s ohledem na specifika datových souborů a výpočtů z oblasti neurovědního výzkumu. Důraz bude kladen především na správnou aplikaci těchto metod v praxi a na interpretaci dosažených výsledků. Probíraná teorie vždy bude následována praktickými příklady s využitím software STATISTICA, SPSS, R a MATLAB, které jsou na Masarykově univerzitě volně dostupné. Po absolvování předmětu budou studenti schopni:

  • správně připravit data pro vícerozměrnou analýzu
  • korektně vícerozměrná data popsat a vizualizovat
  • zvolit vhodnou metriku vzdálenosti či podobnosti
  • vybrat a aplikovat adekvátní shlukovací metodu
  • redukovat a transformovat vícerozměrná data pomocí metod ordinační analýzy
  • klasifikovat data pomocí různých metod diskriminační analýzy
  • vyhodnotit úspěšnost klasifikace
  • interpretovat výsledky získané prostřednictvím pokročilých vícerozměrných metod

Osnova

  1. Úvod do pokročilé vícerozměrné analýzy dat: Význam a cíle vícerozměrné analýzy dat. Příklady využití vícerozměrných analýz. Datová matice a značení. Tabulkové a grafické zpracování vícerozměrných dat.
  2. Vícerozměrné statistické testy a rozložení: Vícerozměrné charakteristiky – vícerozměrný průměr, kovarianční matice, matice korelačních koeficientů. Vícerozměrné normální rozdělení. Vícerozměrný t-test. Vícerozměrná analýza rozptylu. Transformace a jiné úpravy vícerozměrných dat.
  3. Podobnosti a vzdálenosti ve vícerozměrném prostoru: Metriky pro určení vzdálenosti – Euklidova, Hammingova, Mahalanobisova apod. Metriky pro určení podobnosti – Tanimotův, Jaccardův či Sokalův-Michenerův koeficient podobnosti. Asociační matice.
  4. Shluková analýza: Podstata a cíle shlukové analýzy dat. Shluková analýza hierarchická – hierarchické aglomerativní shlukování (metoda nejbližšího souseda (nearest neighbor clustering), metoda nejvzdálenějšího souseda (furthest neighbor clustering), metoda průměrné vazby (average linkage clustering), centroidová metoda (centroid method), Wardova metoda (Ward‘s method)), hierarchické divizivní shlukování. Shluková analýza nehierarchická – metoda k-průměrů (k-means clustering), metoda x průměrů (x-means clustering), metoda x-medoidů (partitioning around medoids). Identifikace optimálního počtu shluků.
  5. Ordinační analýzy I: Principy redukce dimenzionality dat. Selekce a extrakce proměnných. Analýza hlavních komponent (principal component analysis, PCA). Faktorová analýza (factor analysis, FA).
  6. Ordinační analýzy II: Analýza nezávislých komponent (independent component analysis, ICA). Přehled dalších metod ordinační analýzy – korespondenční analýza (correspondence analysis, CA), vícerozměrné škálování (multidimensional scaling, MDS), redundanční analýza (redundancy analysis, RDA), kanonická korelační analýza (canonical correlation analysis, CCorA).
  7. Klasifikace I: Principy a cíle klasifikace. Diskriminační analýza pomocí diskriminačních funkcí – Bayesův klasifikátor (Bayes classifier). Diskriminační analýza pomocí minimální vzdálenosti. Diskriminační analýza pomocí hranic – Fisherova lineární diskriminační analýza (Fisher’s linear discriminant analysis, LDA). Souvislost lineární diskriminační analýzy s logistickou regresí.
  8. Klasifikace II: Diskriminační analýza pomocí hranic – metoda podpůrných vektorů (support vector machines, SVM). Přehled dalších klasifikačních metod – klasifikační stromy a lesy, neuronové sítě. Hodnocení úspěšnosti klasifikace – křížová validace (cross-validation), srovnání úspěšnosti klasifikace s náhodnou klasifikací, srovnání dvou a více klasifikátorů.

Literatura

  • DUDA R. O., HART P. E., STORK D. G., 2000: Pattern Classification. Wiley-Interscience, New York, 680 pp., ISBN 0471056693
  • JOHNSON, R. et al., 2007: Applied multivariate statistical analysis. 6th ed. Prentice Hall, Upper Saddle River, N.J., 773 pp., ISBN 9780135143506
  • BISHOP C., 2006: Pattern Recognition and Machine Learning. Springer, New York, 738 pp., ISBN 0387310738
  • THEODORIDIS, S. et al., 2010: Introduction to pattern recognition: a MATLAB approach. Academic Press, Amsterdam, 219 pp., ISBN 9780123744869
  • HEBÁK, Petr. Vícerozměrné statistické metody (1). Informatorium, Praha. 2004, 239 s., ISBN 8073330253

Výukové metody

Výuka je interaktivní, přímo založená na řešení konkrétních příkladů a problémů analýzy dat s využitím pokročilých vícerozměrných metod. Teoretické podklady i řešené příklady budou studentům k dispozici předem. Studenti si budou moci připravit k řešení své vlastní problémy s analýzou dat (PhD práce, SVOČ, výzkumné práce), které budou postupně každý výukový blok rozebírány a případně i přímo řešeny.

Metody hodnocení

Předmět je ukončen kolokviem sestávajícím se z analýzy praktických příkladů na počítači testujících získané dovednosti analýzy dat pomocí pokročilých vícerozměrných metod.

Informace učitele

Kurz Pokročilé metody analýzy dat v neurovědách bude probíhat v tříhodinových blocích v průběhu 8 týdnů každou středu od 1. 3. 2017 do 3. 5. 2017 kromě 12. 4. a 19. 4. vždy od 16:00 do 19:00 v počítačové učebně IBA LF MU na Kamenici 126/3.

Další komentáře

Předmět je vyučován každoročně v jarním semestru.
Výuka probíhá blokově.
Poznámka k četnosti výuky: 8 dnů po 3 hod.

 

Pro správnou funkci tohoto webu a jeho další zlepšování používáme soubory cookies - více informací. SKRÝT