Pagrindinių komponentų analizė: 4 žingsniai
Pagrindinių komponentų analizė: 4 žingsniai
Anonim
Pagrindinių komponentų analizė
Pagrindinių komponentų analizė

Pagrindinių komponentų analizė yra statistinis metodas, kuris, naudojant ortogonines transformacijas, galimai koreliuojamų kintamųjų rinkinį paverčia linijiškai nekoreliuojamų verčių rinkiniu. Paprastais žodžiais tariant, turint duomenų rinkinį su keliais aspektais, jis padeda sumažinti matmenų skaičių, todėl duomenys tampa lengviau skaitomi.

1 žingsnis: originalūs planai

Aš atėjau į šią klasę su mintimi, kad noriu suprasti ir, tikiuosi, parašyti algoritmą, kuris galėtų atpažinti veidą, kai bus pateiktas kartu su vaizdais. Neturėjau jokios patirties ar žinių, susijusių su veido atpažinimu, ir neįsivaizdavau, kaip sunku pasiekti kažką panašaus. Pasikalbėjęs su profesoriumi Mallochu supratau, kad turiu išmokti daug dalykų, kad galėčiau iki galo suprasti užduotį, kurią galiausiai planavau atlikti.

Po šiek tiek tyrimų aš pagaliau nusprendžiau, kad labiau už viską, ko man reikia norint išmokti linijinės algebros ir kai kurių mašininio mokymosi pagrindų, ir nusprendžiau, kad šios klasės tikslas yra PCA (pagrindinių komponentų analizė).

2 žingsnis: tyrimas

Tyrimai
Tyrimai

Pirmasis žingsnis buvo apsilankyti bibliotekoje ir rasti bet kokią knygą, kuri mane supažindino su mašininiu mokymusi ir, tiksliau, vaizdo apdorojimu. Tai pasirodė daug sunkiau, nei maniau, ir galų gale nieko iš to negavau. Tada nusprendžiau paprašyti draugo, dirbusio „Vision Lab“, kuris paprašė manęs pažvelgti į linijinę algebrą, o tiksliau - savivektorius ir savąsias vertes. Turėjau šiek tiek patirties su linijine algebra iš klasės, kurią mokiausi antrame kurse, bet nesupratau, kaip savivektoriai ar savybės gali būti naudingi dirbant su vaizdais. Daugiau tyrinėdama supratau, kad vaizdai yra ne kas kita, kaip didžiuliai duomenų rinkiniai, todėl juos galima traktuoti kaip matricas, ir man tapo šiek tiek aiškiau, kodėl savivektoriai yra susiję su tuo, ką darau. Šiuo metu nusprendžiau, kad turėčiau išmokti skaityti vaizdus naudojant „python“, nes ketinu naudoti „python“savo projektui. Iš pradžių vaizdams skaityti pradėjau naudodamas CV2.imread, bet tai pasirodė labai lėta, todėl nusprendžiau tai padaryti naudodamas glob ir PIL.image.open, nes tai daug greičiau. Šis procesas popieriuje atrodo palyginti nereikalaujantis daug laiko, tačiau iš tikrųjų užtruko nemažai laiko, nes turėjau išmokti įdiegti ir importuoti skirtingas bibliotekas į „PyCharm“(IDE) ir tada perskaityti kiekvienos bibliotekos dokumentus internete. Tai darydamas aš taip pat išmokau, kaip komandų eilutėje naudoti pip install pareiškimus.

Po to kitas žingsnis buvo išsiaiškinti, ką tiksliai noriu padaryti ir išmokti apdoroti vaizdus, ir iš pradžių planavau derinti šablonus, tačiau tyrinėdamas tai sužinojau apie PCA ir maniau, kad tai įdomiau, todėl nusprendžiau eikite su PCA. Pirmasis nuolat pasirodęs terminas buvo K-NN (K- artimiausias kaimynas) algoritmas. Tai buvo mano pirmasis susidūrimas su mašinų mokymosi algoritmu. Sužinojau apie mokymo ir testavimo duomenis ir tai, ką reiškia algoritmo „mokymas“. Suprasti K-NN algoritmą taip pat buvo sudėtinga, tačiau buvo labai malonu pagaliau suprasti, kaip jis veikia. Šiuo metu dirbu, kad K-NN kodas veiktų ir esu labai arti pabaigos.

3 žingsnis: Sunkumai ir išmoktos pamokos

Pirmasis didelis sunkumas buvo paties projekto apimtis. Tai buvo labiau orientuota į tyrimus, o ne į fizinį. Savaitėms bėgant, aš pažvelgdavau į pažangą, kurią padarė mano bendraamžiai, ir pajusdavau, kad aš nepakankamai darau arba kad nepadariau pakankamai greitos pažangos ir kartais tai labai demotyvuoja. Pokalbis su profesoriumi Mallochu ir tik raminimas, kad iš tiesų mokausi dalykų, kurie man buvo labai nauji, padėjo man tęsti. Kita problema buvo ta, kad teorinių dalykų žinojimas ir jų taikymas yra du skirtingi dalykai. Nors žinojau, ką turiu daryti, iš tikrųjų kodavimas „python“buvo kitokia istorija. Čia vien tik dokumentų skaitymas internete ir klausimai apie tai žinančių draugų labai padėjo pagaliau išsiaiškinti veiksmų planą.

Aš asmeniškai manau, kad turint didesnę knygų ir dokumentų biblioteką M5 galėtų padėti žmonėms, dirbantiems prie projektų. Taip pat gera idėja „M5“turėti realaus laiko skaitmeninį įrašą apie studentų vykdomus projektus, kad kiti studentai ir darbuotojai galėtų į tai pažvelgti ir įsitraukti.

Kai projektas baigiasi, per tokį trumpą laiką išmokau tiek daug. Aš įgijau labai naudingų mašininio mokymosi žinių ir jaučiuosi padaręs pirmuosius žingsnius, kad galėčiau daugiau į tai įsitraukti. Supratau, kad man patinka kompiuterinė vizija ir kad galbūt norėčiau to siekti net ir ateityje. Svarbiausia, kad sužinojau, kas yra PCA, kodėl ji tokia svarbi ir kaip ja pasinaudoti.

4 žingsnis: kiti veiksmai

Man tai buvo tik įbrėžimas į kažko daug platesnio ir labai svarbaus šiuolaikinio pasaulio, ty mašininio mokymosi, paviršių. Artimiausiu metu planuoju lankyti kursus, susijusius su mašinų mokymusi. Aš taip pat planuoju tobulėti iki veido atpažinimo, nes nuo to ir prasidėjo visas šis projektas. Taip pat turiu idėjų apie apsaugos sistemą, kuri naudotų kombinuotas funkcijas (viena iš jų yra asmens veidas), kad ji būtų tikrai saugi, ir aš noriu tai padaryti ateityje, kai geriau suprasiu dalykus.

Visiems, kaip aš, besidomintiems mašininiu mokymusi ir vaizdų apdorojimu, bet neturintiems ankstesnės patirties, labai siūlyčiau pirmiausia išmokti ir suprasti linijinę algebrą kartu su statistika (ypač paskirstymu). Antra, siūlyčiau perskaityti Christopherio M. Bishopo modelio atpažinimą ir mašinų mokymąsi. Ši knyga padėjo man suprasti pagrindinius dalykus, į kuriuos įsitraukiau, ir yra labai gerai suplanuota.