Overvåket vs Uovervåket læring: Viktige forskjeller

Innholdsfortegnelse:

Anonim

Hva er tilsyn med maskinlæring?

I Overvåket læring trener du maskinen ved hjelp av data som er godt "merket ." Det betyr at noen data allerede er merket med riktig svar. Det kan sammenlignes med læring som foregår i nærvær av en veileder eller en lærer.

En overvåket læringsalgoritme lærer av merkede opplæringsdata, hjelper deg med å forutsi resultater for uforutsette data. Å lykkes med å bygge, skalere og distribuere nøyaktig overvåket maskinlæring Datavitenskapsmodell tar tid og teknisk ekspertise fra et team av dyktige dataforskere. Videre må dataforsker bygge opp modeller for å sikre at den gitte innsikten forblir sant til dataene endres.

I denne veiledningen vil du lære

  • Hva er tilsyn med maskinlæring?
  • Hva er uten tilsyn læring?
  • Hvorfor tilsyn med læring?
  • Hvorfor uten tilsyn læring?
  • Hvordan Supervised Learning fungerer?
  • Hvordan fungerer ikke-veiledet læring?
  • Typer overvåket maskinlæringsteknikk
  • Typer av maskinlæringsteknikker uten tilsyn
  • Overvåket vs Uovervåket læring

Hva er uten tilsyn læring?

Uovervåket læring er en maskinlæringsteknikk, der du ikke trenger å overvåke modellen. I stedet må du la modellen jobbe alene for å oppdage informasjon. Den handler hovedsakelig med umerkede data.

Uovervåket læringsalgoritmer lar deg utføre mer komplekse behandlingsoppgaver sammenlignet med veiledet læring. Selv om ikke-veiledet læring kan være mer uforutsigbar sammenlignet med andre naturlige læringsmetoder for dyp læring og forsterkning.

Hvorfor tilsyn med læring?

  • Overvåket læring lar deg samle inn data eller produsere datautdata fra forrige erfaring.
  • Hjelper deg med å optimalisere ytelseskriterier ved hjelp av erfaring
  • Overvåket maskinlæring hjelper deg med å løse ulike typer virkelige beregningsproblemer.

Hvorfor uten tilsyn læring?

Her er hovedårsakene til å bruke Unsupervised Learning:

  • Uovervåket maskinlæring finner alle slags ukjente mønstre i data.
  • Uovervåket metode hjelper deg med å finne funksjoner som kan være nyttige for kategorisering.
  • Det foregår i sanntid, så alle inngangsdataene som skal analyseres og merkes i nærvær av elever.
  • Det er lettere å få umerkede data fra en datamaskin enn merkede data, som trenger manuell inngrep.

Hvordan Supervised Learning fungerer?

For eksempel vil du trene en maskin for å hjelpe deg med å forutsi hvor lang tid det vil ta deg å kjøre hjem fra arbeidsplassen din. Her begynner du med å lage et sett med merkede data. Disse dataene inkluderer

  • Værforhold
  • Tid på dagen
  • Ferier

Alle disse detaljene er dine innganger. Resultatet er hvor lang tid det tok å kjøre hjem den spesifikke dagen.

Du vet instinktivt at hvis det regner ute, vil det ta lenger tid å kjøre hjem. Men maskinen trenger data og statistikk.

La oss nå se hvordan du kan utvikle en overvåket læringsmodell for dette eksemplet som hjelper brukeren å bestemme pendlingstiden. Det første du trenger å lage er et treningsdatasett. Dette treningssettet vil inneholde total pendeltid og tilhørende faktorer som vær, tid osv. Basert på dette treningssettet, kan maskinen din se at det er et direkte forhold mellom mengden regn og tid det tar å komme hjem.

Så det konstaterer at jo mer det regner, jo lenger vil du kjøre for å komme tilbake til hjemmet ditt. Det kan også se sammenhengen mellom tiden du forlater jobben og tiden du er på veien.

Jo nærmere du er 18.00, jo lengre tid det tar før du kommer hjem. Maskinen din kan finne noen av forholdene til de merkede dataene dine.

Dette er starten på datamodellen din. Det begynner å påvirke hvordan regn påvirker måten folk kjører på. Det begynner også å se at flere reiser i løpet av en bestemt tid på dagen.

Hvordan fungerer ikke-veiledet læring?

La oss ta saken med en baby og hennes familiehund.

Hun kjenner og identifiserer denne hunden. Noen få uker senere tar en familievenn med seg en hund og prøver å leke med babyen.

Baby har ikke sett denne hunden tidligere. Men den gjenkjenner mange funksjoner (to ører, øyne, å gå på 4 ben) er som kjæledyrhunden hennes. Hun identifiserer et nytt dyr som en hund. Dette er læring uten tilsyn, der du ikke blir undervist, men du lærer av dataene (i dette tilfellet data om en hund.) Hadde dette vært veiledet læring, ville familievenninnen ha fortalt babyen at det er en hund.

Typer overvåket maskinlæringsteknikk

Regresjon:

Regresjonsteknikk forutsier en enkelt utgangsverdi ved hjelp av treningsdata.

Eksempel: Du kan bruke regresjon til å forutsi boligprisen fra treningsdata. Inngangsvariablene vil være lokalitet, størrelse på et hus osv.

Klassifisering:

Klassifisering betyr å gruppere utdataene i en klasse. Hvis algoritmen prøver å merke inngang i to forskjellige klasser, kalles det binær klassifisering. Å velge mellom mer enn to klasser kalles multiklasseklassifisering.

Eksempel : Bestemme om noen vil være mislighold av lånet eller ikke.

Styrker : Outputs har alltid en sannsynlig tolkning, og algoritmen kan reguleres for å unngå overmontering.

Svakheter : Logistisk regresjon kan underprestere når det er flere eller ikke-lineære beslutningsgrenser. Denne metoden er ikke fleksibel, så den fanger ikke mer komplekse forhold.

Typer av maskinlæringsteknikker uten tilsyn

Uoppsynte læringsproblemer videre gruppert i klyngeproblemer og tilknytningsproblemer.

Gruppering

Klynging er et viktig konsept når det gjelder læring uten tilsyn. Det handler hovedsakelig om å finne en struktur eller et mønster i en samling av ukategoriserte data. Klyngealgoritmer vil behandle dataene dine og finne naturlige klynger (grupper) hvis de finnes i dataene. Du kan også endre hvor mange klynger algoritmene dine skal identifisere. Det lar deg justere granulariteten til disse gruppene.

assosiasjon

Foreningsregler lar deg etablere assosiasjoner mellom dataobjekter i store databaser. Denne ukontrollerte teknikken handler om å oppdage spennende sammenhenger mellom variabler i store databaser. For eksempel er det mest sannsynlig at folk som kjøper et nytt hjem kjøper nye møbler.

Andre eksempler:

  • En undergruppe av kreftpasienter gruppert etter deres genuttrykkelsesmålinger
  • Grupper av kunder basert på deres nettleser- og innkjøpshistorikk
  • Filmgruppe etter rangering gitt av film seere

Overvåket vs Uovervåket læring

Parametere Overvåket maskinlæringsteknikk Uovervåket maskinlæringsteknikk
Prosess I en veiledet læringsmodell vil input og output variabler bli gitt. I ikke-overvåket læringsmodell vil bare inngangsdata bli gitt
Inndata Algoritmer blir trent ved hjelp av merkede data. Algoritmer brukes mot data som ikke er merket
Algoritmer brukt Støtte vektormaskin, nevrale nettverk, lineær og logistisk regresjon, tilfeldig skog og klassifiseringstrær. Uovervåket algoritmer kan deles inn i forskjellige kategorier: som klyngealgoritmer, K-betyr, hierarkisk klynging, etc.
Computational Complexity Veiledet læring er en enklere metode. Uovervåket læring er beregningsmessig kompleks
Bruk av data Overvåket læringsmodell bruker treningsdata for å lære en kobling mellom inngang og utgang. Uovervåket læring bruker ikke utdata.
Nøyaktighet av resultatene Svært nøyaktig og pålitelig metode. Mindre nøyaktig og pålitelig metode.
Sanntids læring Læringsmetoden foregår offline. Læringsmetoden foregår i sanntid.
Antall klasser Antall klasser er kjent. Antall klasser er ikke kjent.
Hoved ulempe Klassifisering av big data kan være en reell utfordring i Supervised Learning. Du kan ikke få presis informasjon om datasortering, og utdataene som data som brukes i tilsyn uten læring er merket og ikke kjent.

Sammendrag

  • I Overvåket læring trener du maskinen ved hjelp av data som er godt "merket."
  • Uovervåket læring er en maskinlæringsteknikk, der du ikke trenger å overvåke modellen.
  • Overvåket læring lar deg samle inn data eller produsere datautdata fra forrige erfaring.
  • Uovervåket maskinlæring hjelper deg med å finne alle slags ukjente mønstre i data.
  • For eksempel vil du kunne bestemme tiden det tar å komme tilbake, basert på værforhold, tid på dagen og ferie.
  • For eksempel kan Baby identifisere andre hunder basert på tidligere veiledet læring.
  • Regresjon og klassifisering er to typer overvåket maskinlæringsteknikk.
  • Klynging og tilknytning er to typer uten tilsyn læring.
  • I en overvåket læringsmodell vil inngangs- og utgangsvariabler gis mens med ikke-overvåket læringsmodell, vil bare inngangsdata bli gitt