Úvod |
V tejto analýze budeme využívať metódy zhlukovej analýzy na popis heterogenity pacientov s akútnou lymfoblastickou leukémiou (ALL) podľa ich genových expresných profilov. Genový expresný profil je výsledok jedného microarray experimentu a obsahuje data o množstve mRNA prislúchajúcej konkrétnemu génu. V jednom microarray experimente súčasne kvantifikujeme aktivitu až tisícov génov. Zároveň detekované homogénne skupiny pacientov charaktrizujeme dostupnými klinickými premennými.
|
Postupné kroky datové analýzy |
||||||||
|
Krok 1: Zoznámenie sa s klinickými parametrami |
|
Dáta sú uložené vo formáte (hovoríme tiež o objekte triedy a zistíme to príkazom class(ALL)) ExpressionSet. Ide o štandardný formát mikročipových dát v R. Jeho hlavnou výhodou je, že obsahuje nielen génové expresné profily, ale aj klinické informácie o pacientoch a popis sond použitého mikročipu. Predtým ako pristúpime k samostnej zhlukovej analýze musíme sa podrobne zoznámit s dátovým súborom: skontrolovať jeho správnosť a kvalitu a prípadne vylúčiť nekvalitné vzorky. Zároveň si predstavíme prácu s formátom ExpressionSet.
|
Navrhované možnosti |
|
Vek sumarizujeme pomocou funkcie summary a pre podtypy vykreslíme stĺpcový graf. |
Použijeme boxplot pre vek a table pre molekulárne podtypy. |
Vek sumarizujeme pomocou table a pre podtypy použijeme histogram. |
Vek znázornime ako histogram a molekulárne podtypy sumarizujeme funkciou table. |
####################################### # # # Analýza č. 2 - Clusterová analýza # # # ####################################### library(ALL) data(ALL) ls() ## Krok č. 1 - Zoznámenie sa s klinickými parametrami ## Krok č. 2 - Zoznámenie sa s expresnými profilmi ## Krok č. 3 - Filtrácia dát ## Krok č. 4 - Určenie vzdialenosti ## Krok č. 5 - Určenie metódy zhlukovania ## Krok č. 6 - Rezanie dendrogramu ## Krok č. 7 - Konsensuálne zhlukovanie ## Krok č. 8 - Popis detekovaných zhlukov