Følgende er ofte stilte spørsmål i intervjuer for nybegynnere samt erfaren ETL-tester og utvikler.
1) Hva er ETL?
I datalagringsarkitektur er ETL en viktig komponent som styrer dataene for enhver forretningsprosess. ETL står for Extract, Transform and Load . Extract gjør prosessen med å lese data fra en database. Transform gjør konvertering av data til et format som kan være hensiktsmessig for rapportering og analyse. Mens load gjør prosessen med å skrive dataene i måldatabasen.
2) Forklar hva inkluderer ETL-testoperasjonene?
ETL-testing inkluderer
- Kontroller om dataene transformeres riktig i henhold til forretningskravene
- Bekreft at de projiserte dataene er lastet inn i datalageret uten avkorting og tap av data
- Forsikre deg om at ETL-applikasjonen rapporterer ugyldige data og erstattes med standardverdier
- Sørg for at data lastes inn til forventet tidsramme for å forbedre skalerbarhet og ytelse
3) Nevn hvilke typer datalagerapplikasjoner og hva er forskjellen mellom datamining og datalagring?
Typene datalagerapplikasjoner er
- Informasjonsbehandling
- Analytisk behandling
- Datautvinning
Data mining kan defineres som prosessen med å trekke ut skjult prediktiv informasjon fra store databaser og tolke dataene mens datalagring kan gjøre bruk av en data mine for analytisk behandling av dataene på en raskere måte. Datalager er prosessen med å samle data fra flere kilder til ett felles lager
4) Hva er de forskjellige verktøyene som brukes i ETL?
- Cognos Decision Stream
- Oracle Warehouse Builder
- Forretningsobjekter XI
- SAS forretningslager
- SAS Enterprise ETL-server
5) Hva er faktum? Hva er typene fakta?
Det er en sentral komponent i en flerdimensjonal modell som inneholder tiltakene som skal analyseres. Fakta er relatert til dimensjoner.
Typer fakta er
- Tilsetningsfakta
- Semi-additiv fakta
- Ikke-additiv fakta
6) Forklar hva som er Cubes og OLAP Cubes?
Kuber er databehandlingsenheter som består av faktatabeller og dimensjoner fra datalageret. Det gir flerdimensjonal analyse.
OLAP står for Online Analytics Processing, og OLAP-kube lagrer store data i mutidimensjonal form for rapporteringsformål. Den består av fakta kalt som tiltak kategorisert etter dimensjoner.
7) Forklar hva som er sporingsnivå og hva er typene?
Sporingsnivå er mengden data som er lagret i loggfilene. Sporingsnivå kan klassifiseres i to Normal og Verbose. Normalt nivå forklarer sporingsnivået på en detaljert måte mens detaljert forklarer sporingsnivåene på hver rad.
8) Forklar hva som er Grain of Fact?
Kornfakta kan defineres som nivået der faktainformasjonen lagres. Det er også kjent som faktagranularitet
9) Forklar hva faktisk faktaskema er og hva er tiltak?
En faktatabell uten tiltak er kjent som Factless fact table. Den kan vise antall hendelser som forekommer. For eksempel brukes den til å registrere en hendelse som antall ansatte i et selskap.
De numeriske dataene basert på kolonner i en faktatabell er kjent som Målinger
10) Forklar hva som er transformasjon?
En transformasjon er et depotobjekt som genererer, modifiserer eller overfører data. Transformasjon er av to typer Aktiv og Passiv
11) Forklar bruken av Lookup Transformation?
Lookup Transformation er nyttig for
- Få en relatert verdi fra en tabell ved hjelp av en kolonneverdi
- Oppdater sakte skiftende dimensjonstabell
- Kontroller om poster allerede finnes i tabellen
12) Forklar hva som er partisjonering, hasjpartisjonering og round robin partisjonering?
For å forbedre ytelsen deles transaksjoner under, dette kalles Partitioning. Partisjonering gjør det mulig for Informatica Server å opprette flere tilkoblinger til forskjellige kilder
Typene av partisjoner er
Round-Robin Partisjonering:
- Ved informatica fordeles data jevnt mellom alle partisjoner
- I hver partisjon hvor antall rader som skal behandles, er omtrent det samme, gjelder denne partisjoneringen
Hash-partisjonering:
- For å partisjonere nøkler for å gruppere data mellom partisjoner, bruker Informatica-serveren en hash-funksjon
- Den brukes når det skal sikres at prosessgruppene med rader med samme partisjonsnøkkel i samme partisjon må sikres
13) Nevn hva er fordelen med å bruke DataReader Destination Adapter?
Fordelen med å bruke DataReader Destination Adapter er at den fyller et ADO-rekordsett (består av poster og kolonner) i minnet og eksponerer dataene fra DataFlow-oppgaven ved å implementere DataReader-grensesnittet, slik at andre applikasjoner kan konsumere dataene.
14) Hva er de mulige måtene å oppdatere tabellen ved å bruke SSIS (SQL Server Integration Service)?
For å oppdatere tabellen ved hjelp av SSIS er de mulige måtene:
- Bruk en SQL-kommando
- Bruk et iscenesatt bord
- Bruk hurtigbuffer
- Bruk skriptoppgaven
- Bruk fullt databasenavn for oppdatering hvis MSSQL brukes
15) Hvis du har en kilde som ikke er OLEDB (Object Linking and Embedding Database) for oppslaget, hva ville du gjort?
Hvis du har en ikke-OLEBD-kilde for oppslag, må du bruke Cache for å laste inn data og bruke den som kilde
16) I hvilket tilfelle bruker du dynamisk hurtigbuffer og statisk hurtigbuffer i tilkoblede og ikke-tilkoblede transformasjoner?
- Dynamisk hurtigbuffer brukes når du må oppdatere hovedtabell og sakte skiftende dimensjoner (SCD) type 1
- For flate filer brukes statisk hurtigbuffer
17) Forklar hva som er forskjellene mellom Ukoblet og Tilkoblet oppslag?
Koblet oppslag |
Ukoblet oppslag |
|
- Den brukes når oppslagsfunksjon brukes i stedet for en uttrykkstransformasjon under kartlegging |
|
- Returnerer bare én utgangsport |
|
|
|
|
|
|
|
|
18) Forklar hva er datakildevisning?
En datakildevisning tillater å definere det relasjonelle skjemaet som skal brukes i databasene for analysetjenester. I stedet for direkte fra datakildeobjekter, opprettes dimensjoner og kuber fra datakildevisninger.
19) Forklar hva som er forskjellen mellom OLAP-verktøy og ETL-verktøy?
Forskjellen mellom ETL og OLAP-verktøy er at
ETL-verktøyet er ment for utvinning av data fra eldre systemer og lastes inn i spesifisert database med en eller annen prosess for rensing av data.
Eksempel: Datastadiet, Informatica etc.
Mens OLAP er ment for rapporteringsformål i OLAP-data tilgjengelig i flerretningsmodell.
Eksempel: Forretningsobjekter, Cognos osv.
20) Hvordan kan du trekke ut SAP-data ved hjelp av Informatica?
- Med strømkoblingsalternativet trekker du ut SAP-data ved hjelp av informatica
- Installer og konfigurer PowerConnect-verktøyet
- Importer kilden til Source Analyzer. Mellom Informatica og SAP fungerer Powerconnect som en gateway. Det neste trinnet er å generere ABAP-koden for kartleggingen, så bare informatica kan hente data fra SAP
- For å koble til og importere kilder fra eksterne systemer brukes Power Connect
21) Nevn hva som er forskjellen mellom Power Mart og Power Center?
Power Center |
Power Mart |
|
|
|
|
|
|
|
|
22) Forklar hva iscenesettingsområde er, og hva er formålet med et iscenesettingsområde?
Datainnsamling er et område der du holder dataene midlertidige på datalagerserveren. Datastaging inkluderer følgende trinn
- Ekstraksjon av kildedata og transformasjon av data (restrukturering)
- Datatransformasjon (datarensing, verditransformasjon)
- Surrogat nøkkeloppgaver
23) Hva er bussskjema?
For de forskjellige forretningsprosessene for å identifisere de vanlige dimensjonene, brukes BUS-skjema. Den leveres med samsvarende dimensjoner sammen med en standardisert definisjon av informasjon
24) Forklar hva som er datarensing?
Rensing av data er en prosess for å slette data fra datalageret. Den sletter søppeldata som rader med nullverdier eller ekstra mellomrom.
25) Forklar hva som er skjemaobjekter?
Skjemaobjekter er den logiske strukturen som direkte refererer til databasedataene. Skjemaobjekter inkluderer tabeller, visninger, sekvenssynonymer, indekser, klynger, funksjonspakker og databasekoblinger
26) Forklar disse begrepene Session, Worklet, Mapplet og Workflow?
- Mapplet: Den ordner eller skaper sett med transformasjon
- Worklet: Den representerer et spesifikt sett med oppgaver gitt
- Arbeidsflyt: Det er et sett med instruksjoner som forteller serveren hvordan du skal utføre oppgaver
- Økt: Det er et sett med parametere som forteller serveren hvordan man flytter data fra kilder til mål
Gratis nedlasting av PDF: ETL Testing Interview Questions and Answers