TvorenieSekundárneho vzdelávania a školy

Metóda najbližšieho suseda: príklad práce

najbližšieho suseda metóda je najjednoduchšie metrický triedič, ktorý je založený na vyhodnotenie podobnosti rôznych objektov.

Analyzoval objekt patrí do triedy, ku ktorému patrí predmety vzdelávacieho vzorky. Poďme zistiť, ktorý je najbližší sused. Snažte sa pochopiť komplikovanú záležitosť, ukážky rôznych techník.

spôsob hypotéza

metóda najbližšieho suseda možno považovať za najbežnejšie algoritmu používaného pre klasifikáciu. Objekt prechádza klasifikácie patrí do triedy y_i, na ktoré sa najbližší objekt učenia x_i vzorku.

Špecifickosť metód najbližších susedov

K najbližšieho suseda metóda môže zlepšiť presnosť klasifikácie. Jednotlivé prvky patria do rovnakej skupiny ako hlavná časť jeho susedov, to znamená, že k v blízkosti sa objekty z analyzovanej vzorky x_i. Pri riešení problémov s dvoma triedami počtu susedov bude nepárny, aby sa zabránilo situácii nejednoznačnosti, ak je rovnaký počet susedov bude patriť do rôznych tried.

Technika suspendovaných susedov

Postgresql analyzovaná metódou tsvector najbližších susedov sa používa, keď sa počet tried najmenej tri, a nemožno použiť nepárny počet. Ale dvojznačnosť vyvstáva aj v týchto prípadoch. Potom sa i-ty sused dostane w_i hmotnosť, čo znižuje so susednou pozíciu aj. To sa odkazuje na triedu objektu, ktorá bude mať maximálnou hmotnosťou medzi blízkymi susedmi.

hypotéza kompaktnosti

V srdci všetkých z vyššie uvedených spôsobov je hypotéza kompaktnosti. To naznačuje spojenie medzi mierou podobnosti objektov a ich patrí do rovnakej triedy. V tejto situácii, hranice medzi jednotlivými typmi je jednoduchá forma, a vytvoriť tried objektov vo vesmíre kompaktný mobilnej oblasti. Za takých oblastiach, v matematickej analýze chápaný ako uzavretý obmedzená množina. Táto hypotéza je nesúvisí s každodennou vnímanie slova.

základný vzorec

Poďme preskúmať viac najbližšieho suseda. V prípade, že navrhovaný výcvik druh vzorky "objekt odozvy» X ^ m = \ {(x 1, y_1), \ bodky, (x_m, y_m) \}; v prípade, že množstvo objektov definovať vzdialenosť funkcie \ rho (x, x,), ktorá je zobrazená vo forme zodpovedajúcej modelovej podobnosti objektov zvýšením hodnoty funkcie znižuje podobnosť medzi objektmi x, x '.

Pre akýkoľvek objekt, budú u vybudovať výcvikový vzorku objekty x_i s rastúcou vzdialenosťou k u:

\ Rho (u, x_ {1, u}) \ Leq \ rho (u, x_ {2, u}) \ Leq \ cdots \ Leq \ rho (u, x_ {m, u}),

kde x_ {i; u} charakterizuje učenie objekt vzorku, ktorá je i-tý zdroj sused objekt u. Takýto zápis a použitie odpovedať na i-tého suseda: y_ {i; u}. V dôsledku toho sme zistili, že každý objekt u provokuje prečíslovanie vlastné vzorku.

Stanovenie čísla k susedov

metóda najbližšieho suseda, keď k = 1 je schopný dať chybné klasifikácie, a to nielen na objekty emisiami, ale aj iných tried, ktoré sú v blízkosti.

Ak vezmeme k = m, algoritmus byť stabilné a zvrhnúť do konštantnej hodnote. Preto je spoľahlivosť je dôležité, aby sa zabránilo extrémne indexy k.

V praxi sa ako optimálny index k používa kritérium posuvné ovládanie.

emisie projekcie

Predmetom štúdia sú veľmi nerovné, ale medzi nimi sú tí, ktorí majú vlastnosti triedy a sú označované ako štandardy. V jeho blízkosti je viazaný na ideálneho modelu vysokou pravdepodobnosťou patriace do tejto triedy.

Ako rezultativen Metóda najbližších susedov? Ako príklad je možné vidieť na základe okrajových a neinformativními kategórií objektov. Predpokladá sa, husté prostredie objektu ďalšími zástupcami tejto triedy. Keď sa ich odstránenie zo klasifikácia vzorkovanie kvality neutrpeli.

Dostať sa do určitého počtu vzoriek môže hluku súborov trhlín, ktoré sú "v teréne" triedy. Odstránenie v podstate pozitívny dopad na kvalitu klasifikácie.

V prípade, že vzorka odobratá z uninformative a odstránenie objektov hluku, môžete sa spoľahnúť na niekoľko pozitívnych výsledkov v rovnakom čase.

Prvá metóda interpolácia najbližšieho suseda klasifikácia umožňuje zvýšiť kvalitu, znížiť množstvo uložených dát, skracujú dobu klasifikácie, ktorá sa vynakladá na voľbe ďalších noriem.

Použitie ultra-veľké vzorky

metóda najbližšieho suseda je založený na skutočnom ukladanie výučbových objektov. Ak chcete vytvoriť samotnej vzorky vo veľkom meradle pomocou technického problému. Cieľom nie je len preto, aby ušetriť značné množstvo informácií, ale aj v čo najkratšom čase, aby mali čas nájsť akýkoľvek predmet u K. medzi najbližšími susedmi.

V snahe vyrovnať sa s touto úlohou sa používajú dve metódy:

  • zúžená vzorka odvádzacím než dátových objektov;
  • Efektívne využitie špeciálne dátové štruktúry a kódy pre okamžité hľadanie najbližších susedov.

Pravidlá pre výber metód

bol považovaný za Uvedená klasifikácie. Metóda najbližšieho suseda sa používa pri riešení praktických problémov, ktoré je vopred známe, dištančné funkcie \ rho (x, x,). Pri popise objektov číselné vektory použiť euklidovskej metriky. Táto možnosť nemá žiadny zvláštny dôvod, ale spočíva v meraní všetkých znamení "v rovnakom meradle." Ak nie je tento faktor neberie do úvahy, potom sa metrika bude prevládať funkciu, ktorá má najvyššiu číselné hodnoty.

Ak existuje značné množstvo funkcií, výpočet vzdialenosti ako súčet odchýlok v konkrétnych príznakov objavujú vážne rozmer problému.

Vo vysokom trojrozmernom priestore vzdialenom od seba budú všetky objekty. Nakoniec akýkoľvek vzorka bude vedľa objektu, ktorý študoval K susedom. vybraný malý počet informačných funkcií, ktoré tento problém odstrániť. Algoritmy pre výpočet odhadov budovať na základe rôznych sád značiek, a pre každého jednotlivca stavať svoju funkciu priblíženia.

záver

Matematické výpočty často zahŕňajú použitie rôznych techník, ktoré majú svoje vlastné charakteristické rysy, výhody a nevýhody. Zobrazené metóda najbližšieho suseda môže vyriešiť celkom vážny problém, vzhľadom k vlastnostiam matematickými objekty. Experimentálne koncepcie, na základe analyzované metódou je aktívne používa v oblasti umelej inteligencie.

V expertných systémov je nevyhnutné nielen pre klasifikáciu objektov, ale tiež ukázať užívateľovi vysvetlenie klasifikácie v pochybnosť. V tejto metóde, vysvetlenie tohto javu sú vyjadrené vo vzťahu k predmetu určitej triedy, ako aj jej umiestnenie vzhľadom ku vzorke materiálu. Právne experti priemyslu, geológovia, lekári, aby túto "precedensu" logiku aktívne ju používať vo svojom výskume.

Aby mohla byť analyzovaná metóda bola najspoľahlivejším, efektívne, dávať požadované výsledky, je potrebné vykonať minimálny postava k, a zároveň vylúčenie emisií medzi analyzovaných objektov. Preto je používanie noriem a spôsob výberu, rovnako ako optimalizácia metriky.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sk.atomiyme.com. Theme powered by WordPress.