CZK EUR
Košík 0
Celkem: 0,00 Kč bez DPH

Model logistické regrese

Co to je?

Logistická regrese je klasifikátor, který používá sadu vážených měření k předpovědi třídy (např. zdravý, nemocný), do které vzorek patří na základě pravděpodobnosti.


Kdy se používá?

Tento model se používá, když 1) chceme vzájemně porovnávat ≤ 2 různé skupiny, 2) vzorky jsou na sobě nezávislé, 3) populace mohou, ale nemusí mít normální rozdělení, 4) jsou známé skupiny populace (např. zdraví, nemocní) a 5) transformace dat jinými metodami vede k nesmyslným hodnotám. Obvykle se používá, když je odpověď binární: ano nebo ne, zdravý nebo nemocný atd.


Jak to funguje?


Logistická regrese: Příklad

Analyzujeme proteinový profil 1000 proteinů 100 zdravých pacientů a 100 pacientů s rakovinou pomocí mikročipu založeného na protilátkách. Chceme identifikovat specifické biomarkery, které předpoví, kteří budoucí pacienti jsou zdraví a kteří nemocní.


  1. Data vycentrujte a škálujte tak, že odečtete průměr každého souboru dat pacienta od sebe sama (obrázek 1B) a pak vydělíte každý soubor dat pacienta jeho směrodatnou odchylkou (obrázek 1C). Nyní mají všechny soubory dat průměr 0 a směrodatnou odchylku 1.
  2. Přizpůsobte logistický model na základě podmnožiny proměnných (obrázek 2). Toho se dosáhne přidáním různých vah biomarkerům. Data by měla mít tvar písmene S (tj. sigmoidní funkce).
  3. Vyhodnoťte výkonnost modelu pomocí analýzy křivky ROC (obrázek 3).

 

 

Obrázek 1. Příklad centrování a škálování dat. A) Úroveň exprese proteinu "X" ve dvou souborech dat je B) centrována a C) škálována tak, aby všechny soubory dat měly průměr 0 a směrodatnou odchylku 1.

 

Obrázek 2. Proteinová odezva napříč všemi daty je A) vynesena do grafu a B) přiřazena ke stavu pacienta (tj. zdravý, nádorové onemocnění). Všimněte si, že na obrázcích 2A a 2B je zobrazen 1 protein, ale na ose x může být kombinace proteinů.

 

Obrázek 3. Příklady biomarkerů s různou prediktivní schopností pro určení zdravotního stavu pacienta. A) Protein 1 by byl určen jako dobrý biomarker rakoviny, zatímco B) Protein 2 by nebyl dobrým biomarkerem. Zelená = zdravý; červená = rakovina.

 

Jak vypadají data?

Údaje lze prezentovat ve formátu tabulky, v níž by byly uvedeny biomarkery a jejich odpovídající koeficienty (tj. váhy), které jsou v modelu použity. Výkonnost logistické regrese se hodnotí pomocí analýzy křivky ROC.

 

(Převzato od společnosti RayBiotech, redakčně upraveno.)

Prémiové produkty pro vědu, zdravotnictví a výrobu