Last ned PDF
1) Hva er maskinlæring?
Maskinlæring er en gren av informatikk som omhandler systemprogrammering for automatisk å lære og forbedre med erfaring. For eksempel: Roboter er programmert slik at de kan utføre oppgaven basert på data de samler fra sensorer. Den lærer automatisk programmer fra data.
2) Nevn forskjellen mellom Data Mining og Machine Learning?
Maskinlæring er relatert til studiet, utformingen og utviklingen av algoritmene som gir datamaskiner muligheten til å lære uten å være eksplisitt programmert. Mens data mining kan defineres som prosessen der ustrukturerte data prøver å hente ut kunnskap eller ukjente interessante mønstre. I løpet av denne prosessmaskinen brukes læringsalgoritmer.
3) Hva er 'overmontering' i maskinlæring?
I maskinlæring, når en statistisk modell beskriver tilfeldig feil eller støy i stedet for underliggende forhold, oppstår 'overmontering'. Når en modell er for kompleks, observeres normalt overmontering på grunn av å ha for mange parametere med hensyn til antall treningsdatatyper. Modellen viser dårlig ytelse som har vært overfit.
4) Hvorfor skjer overmontering?
Muligheten for overmontering eksisterer da kriteriene som brukes for å trene modellen ikke er de samme som kriteriene som brukes for å bedømme effektiviteten til en modell.
5) Hvordan kan du unngå overmontering?
Ved å bruke mye data kan overmontering unngås, overmontering skjer relativt når du har et lite datasett, og du prøver å lære av det. Men hvis du har en liten database, og du blir tvunget til å komme med en modell basert på det. I en slik situasjon kan du bruke en teknikk kjent som kryssvalidering . I denne metoden deles datasettet i to seksjoner, test- og treningsdatasett, testdatasettet vil bare teste modellen mens datapunktene i opplæringsdatasettet vil komme opp med modellen.
I denne teknikken blir en modell vanligvis gitt et datasett med kjente data som trening (treningsdatasett) kjøres på og et datasett med ukjente data som modellen testes mot. Ideen med kryssvalidering er å definere et datasett for å "teste" modellen i treningsfasen.
6) Hva er induktiv maskinlæring?
Den induktive maskinlæringen involverer prosessen med å lære ved eksempler, der et system fra et sett av observerte forekomster prøver å indusere en generell regel.
7) Hva er de fem populære algoritmene til maskinlæring?
- Beslutningstrær
- Nevrale nettverk (forplantning av ryggen)
- Probabilistiske nettverk
- Nærmeste nabo
- Støtt vektormaskiner
8) Hva er de forskjellige algoritmeteknikkene i maskinlæring?
De forskjellige typene teknikker innen maskinlæring er
- Veiledet læring
- Uovervåket læring
- Semi-veiledet læring
- Forsterkningslæring
- Transduksjon
- Lære å lære
9) Hva er de tre trinnene for å bygge hypotesene eller modellen i maskinlæring?
- Modellbygging
- Modelltesting
- Bruk av modellen
10) Hva er standard tilnærming til veiledet læring?
Standard tilnærming til veiledet læring er å dele eksemplet i opplæringssett og test.
11) Hva er 'Treningssett' og 'Testsett'?
I ulike områder av informasjonsvitenskap som maskinlæring, brukes et sett med data for å oppdage det potensielt prediktive forholdet kjent som 'Training Set'. Treningssett er eksempler gitt til eleven, mens testsett brukes til å teste nøyaktigheten av hypotesene generert av eleven, og det er eksemplet som holdes tilbake fra eleven. Treningssett er forskjellig fra testsett.
12) Liste opp ulike tilnærminger for maskinlæring?
De forskjellige tilnærmingene i maskinlæring er
- Konsept mot klassifisering
- Symbolisk mot statistisk læring
- Induktiv mot analytisk læring
13) Hva er ikke maskinlæring?
- Kunstig intelligens
- Regelbasert slutning
14) Forklar hva som er funksjonen til 'Uovervåket læring'?
- Finn klynger av dataene
- Finn lavdimensjonale representasjoner av dataene
- Finn interessante veibeskrivelser i data
- Interessante koordinater og korrelasjoner
- Finn nye observasjoner / rengjøring av databaser
15) Forklar hva som er funksjonen til 'Overvåket læring'?
- Klassifiseringer
- Talegjenkjenning
- Regresjon
- Forutsi tidsserier
- Kommenter strenger
16) Hva er algoritmeuavhengig maskinlæring?
Maskinlæring der matematiske grunnlag er uavhengig av en bestemt klassifikator eller læringsalgoritme blir referert til som algoritmeuavhengig maskinlæring?
17) Hva er forskjellen mellom kunstig læring og maskinlæring?
Å designe og utvikle algoritmer i henhold til atferd basert på empiriske data er kjent som Machine Learning. Mens kunstig intelligens i tillegg til maskinlæring, dekker den også andre aspekter som kunnskapsrepresentasjon, naturlig språkbehandling, planlegging, robotikk etc.
18) Hva er klassifisering innen maskinlæring?
En klassifisering i en maskinlæring er et system som legger inn en vektor med diskrete eller kontinuerlige funksjonsverdier og sender ut en enkelt diskret verdi, klassen.
19) Hva er fordelene med Naive Bayes?
I Naïve Bayes vil klassifisereren konvergere raskere enn diskriminerende modeller som logistisk regresjon, så du trenger mindre treningsdata. Den største fordelen er at den ikke kan lære interaksjoner mellom funksjoner.
20) På hvilke områder Mønstergjenkjenning brukes?
Mønstergjenkjenning kan brukes i
- Datamaskin syn
- Talegjenkjenning
- Datautvinning
- Statistikk
- Uformell henting
- Bioinformatikk
21) Hva er genetisk programmering?
Genetisk programmering er en av de to teknikkene som brukes i maskinlæring. Modellen er basert på testing og valg av det beste valget blant et sett med resultater.
22) Hva er induktiv logisk programmering i maskinlæring?
Induktiv logisk programmering (ILP) er et underfelt av maskinlæring som bruker logisk programmering som representerer bakgrunnskunnskap og eksempler.
23) Hva er modellvalg i maskinlæring?
Prosessen med å velge modeller blant forskjellige matematiske modeller, som brukes til å beskrive det samme datasettet, er kjent som Model Selection. Modellvalg brukes på feltene statistikk, maskinlæring og data mining.
24) Hva er de to metodene som brukes til kalibrering i veiledet læring?
De to metodene som brukes for å forutsi gode sannsynligheter i Veiledet læring er
- Platt kalibrering
- Isotonisk regresjon
Disse metodene er designet for binær klassifisering, og det er ikke trivielt.
25) Hvilken metode brukes ofte for å forhindre overmontering?
Når det er tilstrekkelige data, brukes 'Isotonisk regresjon' for å forhindre et problem med overmontering.
26) Hva er forskjellen mellom heuristikk for regelinnlæring og heuristikk for beslutningstrær?
Forskjellen er at heuristikken for beslutningstrær evaluerer gjennomsnittskvaliteten til et antall usammenhengende sett, mens regelelevene bare vurderer kvaliteten på settet av forekomster som dekkes av kandidatregelen.
27) Hva er Perceptron i maskinlæring?
I maskinlæring er Perceptron en algoritme for overvåket klassifisering av inngangen i en av flere mulige ikke-binære utganger.
28) Forklar de to komponentene i det bayesiske logikkprogrammet?
Bayesian logikkprogram består av to komponenter. Den første komponenten er en logisk; den består av et sett med Bayesian-klausuler, som fanger opp den kvalitative strukturen til domenet. Den andre komponenten er kvantitativ, den koder kvantitativ informasjon om domenet.
29) Hva er Bayesian Networks (BN)?
Bayesian Network brukes til å representere den grafiske modellen for sannsynlighetsforhold mellom et sett med variabler.
30) Hvorfor forekomstbasert læringsalgoritme noen ganger referert til som Lazy learning algoritme?
Instansbasert læringsalgoritme blir også referert til som Lazy learning-algoritme ettersom de forsinker induksjons- eller generaliseringsprosessen til klassifiseringen er utført.
31) Hva er de to klassifiseringsmetodene som SVM (Support Vector Machine) kan håndtere?
- Kombinere binære klassifikatorer
- Modifisering av binær for å inkludere læring i flere klasser
32) Hva er ensemble-læring?
For å løse et bestemt beregningsprogram genereres og kombineres flere modeller som klassifikatorer eller eksperter. Denne prosessen er kjent som ensemble læring.
33) Hvorfor blir ensembleopplæring brukt?
Ensemble læring brukes til å forbedre klassifisering, prediksjon, tilnærming av funksjoner osv. Til en modell.
34) Når skal man bruke ensemblelæring?
Ensemble-læring brukes når du bygger komponentklassifiserere som er mer nøyaktige og uavhengige av hverandre.
35) Hva er de to paradigmene for ensemblemetoder?
De to paradigmene for ensemblemetoder er
- Sekvensielle ensemblemetoder
- Parallelle ensemblemetoder
36) Hva er det generelle prinsippet for en ensemblemetode og hva er bagging og boosting i ensemblemetoden?
Det generelle prinsippet for en ensemblemetode er å kombinere spådommer fra flere modeller bygget med en gitt læringsalgoritme for å forbedre robustheten over en enkelt modell. Bagging er en metode i ensemblet for å forbedre ustabile estimerings- eller klassifikasjonsordninger. Mens boosting-metoden brukes sekvensielt for å redusere forspenningen til den kombinerte modellen. Boosting og Bagging kan begge redusere feil ved å redusere variansperioden.
37) Hva er bias-varians dekomponering av klassifiseringsfeil i ensemblemetoden?
Den forventede feilen til en læringsalgoritme kan spaltes i skjevhet og varians. En bias-term måler hvor nær den gjennomsnittlige klassifisereren produsert av læringsalgoritmen samsvarer med målfunksjonen. Variansbegrepet måler hvor mye prediksjonen til læringsalgoritmen svinger for forskjellige treningssett.
38) Hva er en inkrementell læringsalgoritme i ensemblet?
Inkrementell læringsmetode er en algoritmes evne til å lære av nye data som kan være tilgjengelige etter at klassifisereren allerede er generert fra allerede tilgjengelig datasett.
39) Hva brukes PCA, KPCA og ICA til?
PCA (Principal Components Analysis), KPCA (Kernel based Principal Component Analysis) og ICA (Independent Component Analysis) er viktige trekk ved ekstraksjonsteknikker som brukes for dimensjonsreduksjon.
40) Hva er dimensjonsreduksjon i maskinlæring?
I maskinlæring og statistikk er dimensjonsreduksjon prosessen med å redusere antall tilfeldige variabler under hensyn og kan deles inn i funksjonsvalg og funksjonsutvinning.
41) Hva er støttevektormaskiner?
Støttevektormaskiner er overvåket læringsalgoritmer som brukes til klassifisering og regresjonsanalyse.
42) Hva er komponentene i relasjonelle evalueringsteknikker?
De viktige komponentene i relasjonelle evalueringsteknikker er
- Datainnsamling
- Ground Truth Acquisition
- Kryssvalideringsteknikk
- Spørringstype
- Poengmåling
- Betydningstest
43) Hva er de forskjellige metodene for sekvensiell overvåket læring?
De forskjellige metodene for å løse problemer med sekvensiell overvåket læring er
- Metoder for skyvevindu
- Tilbakevendende skyvevinduer
- Skjulte Markow-modeller
- Maksimal entropi Markow-modeller
- Betingede tilfeldige felt
- Graftransformator nettverk
44) Hva er områdene innen robotikk og informasjonsbehandling der det oppstår et sekvensielt prediksjonsproblem?
Områdene innen robotikk og informasjonsbehandling der det oppstår sekvensiell prediksjon
- Imitasjonslæring
- Strukturert prediksjon
- Modellbasert forsterkningslæring
45) Hva er batch statistisk læring?
Statistiske læringsteknikker gjør det mulig å lære en funksjon eller prediktor fra et sett med observerte data som kan forutsi usete eller fremtidige data. Disse teknikkene gir garantier for ytelsen til den lærte prediktoren for fremtidige usynlige data basert på en statistisk antagelse om datagenereringsprosessen.
46) Hva er PAC-læring?
PAC-læring (sannsynligvis omtrent korrekt) er et læringsrammeverk som er introdusert for å analysere læringsalgoritmer og deres statistiske effektivitet.
47) Hva er de forskjellige kategoriene du kan kategorisere sekvenslæringsprosessen?
- Forutsigelse av sekvenser
- Sekvensgenerering
- Sekvensgjenkjenning
- Sekvensiell avgjørelse
48) Hva er sekvenslæring?
Sekvenslæring er en metode for undervisning og læring på en logisk måte.
49) Hva er to teknikker for maskinlæring?
De to teknikkene for maskinlæring er
- Genetisk programmering
- Induktiv læring
Anbefalingsmotoren implementert av store netthandelsnettsteder bruker Machine Learning.