Analýza hlavních komponent

Kategorie: Nezařazeno (celkem: 23181 referátů a seminárek)

Informace o referátu:

Příbuzná témata



Analýza hlavních komponent

Analýza hlavních komponent (Principal Component Analysis) je v teorii signálu transformace sloužící k dekorelaci dat. Často se používá ke snížení dimenze dat s co nejmenší ztrátou informace. PCA je možno najít také jako Karhunen-Lo?veho transformaci nebo Hotellingovu transformaci.

Z následujícího vzorce je vidět, že PCA je jen přepsáním vstupu do jiné souřadné soustavy:

Y = XP

kde X je centrovaná matice n x d se vstupními d-rozměrnými daty v n řádcích, Y obdobná matice výstupních dat, P je d x d matice vlastních vektorů kovarianční matice CX splňující vztah CX = P?PT, kde ? je diagonální matice obsahující na diagonále vlastní čísla CX a matice vlastních vektorů P je ortonormální, tj. PTP = Id, kde Id je jednotková matice dimenze d.

Vlastní vektory (sloupce matice P) tvoří onu novou souřadnou soustavu. Centrování matice X dosáhneme odečtením příslušného výběrového průměru od každého sloupce.


Obsah

Odvození

Matice Y je zřejmě také centrovaná, t.j., aritmetický průměr každého jejího sloupce je 0.

Spočítáme, jak musí vypadat kovarianční matice nových dat Y:

CY = E(YTY) = E[(XP)T(XP)] = E(PTXTXP) = PTE(XTX)P = PTCXP = PTP?PTP = ?.

Vzhledem k tomu, že matice ? je diagonální,

C_Y = Lambda = left ( egin{matrix}
lambda_1 & & \
          & ddots &            \
          &        & lambda_d  \
end{matrix}
ight ),

vidíme, že sloupce matice Y jsou nekorelované a výběrový rozptyl každého sloupce se rovná příslušnému vlastnímu číslu.



Použití

Seřadíme-li vlastní vektory v P podle velikosti vlastních čísel ?i, budeme dostávat složky v Y setříděné podle rozptylu. Pokud chceme snížit dimenzi dat, stačí z Y vzít jen tolik prvních složek kolik uznáme za vhodné. Vybírání komponenty s největším rozptylem nemusí být vždy nejlepší. Například pokud máme rozpoznávat třídy, které se liší právě ve složkách s malým rozptylem, které tímto postupem zahodíme.

Rozpoznávání

V rozpoznávání slouží PCA jako jedna z tzv. Feature Extraction metod. Používají ji například kriminalisté pro rozpoznávání obličejů.

Komprese

Jednoduchá komprese barevného nebo multispektrálního obrazu. Využívá vysoké korelace mezi jednotlivými spektrálními kanály a převede obrázek pomocí PCA na jednu nebo několik málo složek s většinou informace.

Viz také



Nový příspěvek


Ochrana proti spamu. Kolik je 2x4?



Na-mobil.cz

Spřátelené weby

Přidat stránku k oblíbeným

Nejnovější v diskusi

Diskusní fórum »

TIP: Chcete zkrátit dlouho chvíli sobě nebo blízkému?
Klikněte na Puzzle-prodej.cz a vyberte si z 5000 motivů skladem!
TIP: Hračky a hry za dobré ceny?
Klikněte na Hračky obchod.cz a vyberte si z tisícovky hraček skladem!