Her er spørsmål om datamodellering for ferskere og erfarne kandidater.
1) Hva er datamodellering?
Datamodellering er prosessen med å lage en modell for dataene som skal lagres i en database. Det er en konseptuell fremstilling av dataobjekter, sammenhengen mellom forskjellige dataobjekter og reglene.
2) Forklar forskjellige typer datamodeller
Det er hovedsakelig tre forskjellige typer datamodeller:
Konseptuell: Konseptuell datamodell definerer hva systemet skal inneholde. Denne modellen er vanligvis laget av forretningsinteressenter og dataarkitekter. Hensikten er å organisere, omfang og definere forretningskonsepter og regler.
Logisk: Definerer hvordan systemet skal implementeres uavhengig av DBMS. Denne modellen er vanligvis laget av dataarkitekter og forretningsanalytikere. Hensikten er å utvikle et teknisk kart over regler og datastrukturer.
Fysisk: Denne datamodellen beskriver hvordan systemet skal implementeres ved hjelp av et spesifikt DBMS-system. Denne modellen er vanligvis laget av DBA og utviklere. Hensikten er den faktiske implementeringen av databasen.
3) Forklar fakta- og faktatabellen
Faktum representerer kvantitative data. For eksempel nettobeløpet som forfaller. En faktatabell inneholder numeriske data samt fremmede nøkler fra dimensjonstabeller.
4) Liste opp forskjellige designskjemaer i datamodellering
Det er to forskjellige typer skjemaer for datamodelleringsplaner: 1) Stjerneskjema og 2) Snøfnuggskjema
5) Når bør du vurdere denormalisering?
Denormalisering brukes når det er mye involvering av tabellen mens data hentes. Den brukes til å konstruere et datalager.
6) Forklar dimensjon og attributt
Dimensjoner representerer kvalitative data. For eksempel produkt, klasse, plan, etc. En dimensjonstabell har tekstlige eller beskrivende attributter. Produktkategorien og produktnavnet er for eksempel to attributter til produktdimensjonstabellen.
7) Hva er faktum mindre faktum?
Fakta mindre faktum er en tabell uten faktamåling. Den inneholder bare dimensjonstastene.
8) Hva er analyse i minnet?
Analyse i minnet er en prosess for å cache databasen i RAM.
9) Hva er forskjellen mellom OLTP og OLAP?
OLTP | OLAP |
OLTP er et online transaksjonssystem. | OLAP er en online analyse og datainnhentingsprosess. |
Det er preget av et stort antall korte online-transaksjoner. | Det er preget av et stort datamengde. |
OLTP bruker tradisjonell DBMS. | OLAP bruker et datalager. |
Tabeller i OLTP-databasen normaliseres. | Tabellene i OLAP normaliseres ikke. |
Svartiden er i millisekunder. | Svartiden er i sekunder til minutter. |
OLTP er designet for sanntids virksomhet. | OLAP er designet for analyse av forretningsmål etter kategori og attributter. |
10) Hva er bord?
Samlingen av rader og kolonner kalles som tabell. Hver kolonne har en datatype. Tabellen inneholder relaterte data i tabellformat.
11) Hva er kolonne?
Kolonne eller felt er en vertikal ordning av data som inneholder relatert informasjon.
12) Definer datasparhet
Data sparsity er et begrep som brukes for hvor mye data du har for enhet / dimensjon av modellen.
13) Hva er sammensatt primærnøkkel?
Sammensatt primærnøkkel refereres til tilfellet der mer enn én tabellkolonne brukes som en del av primærnøkkelen.
14) Hva er primærnøkkel?
Primærnøkkel er en kolonne eller gruppe av kolonner som ulikt identifiserer hver rad i tabellen. Verdien til primærnøkkel må ikke være null. Hver tabell må inneholde en primærnøkkel.
15) Forklar fremmednøkkel
Utenlandsk nøkkel er en gruppe attributter som brukes til å koble foreldre- og barnebord. Verdien av den utenlandske nøkkelkolonnen, som er tilgjengelig i underordnet tabell, henvises til verdien av primærnøkkelen i overordnet tabell.
16) Hva er metadata?
Metadata beskriver dataene om data. Den viser hvilken type data som faktisk er lagret i databasesystemet.
17) Hva er datamart?
En datamart er en kondensert versjon av et datalager og er designet for bruk av en bestemt avdeling, enhet eller et sett med brukere i en organisasjon. For eksempel markedsføring, HR eller økonomi.
18) Hva er OLTP?
Online transaksjonsbehandling, kort kjent som OLTP, støtter transaksjonsorientert applikasjon i 3-lags arkitektur. OLTP administrerer den daglige transaksjonen til selskapet eller organisasjonen.
19) Hva er eksemplene på OLTP-systemet?
Eksempel på OLTP-system er:
- Sende en tekstmelding
- Legg til en bok i handlekurven
- Online billettbestilling
- Nettbank
- Bestill oppføring
20) Hva er sjekkbegrensning?
Sjekkbegrensning brukes til å verifisere et verdiområde i en kolonne.
21) List opp hvilke typer normalisering?
Typer av normaliseringer er: 1) første normale form, 2) andre normale form, 3) tredje normale former, 4) boyce-codd fjerde, og 5) femte normale former.
22) Hva er forward data engineering?
Forward engineering er et teknisk begrep som brukes for å beskrive prosessen med automatisk å oversette en logisk modell til et fysisk redskap.
23) Hva er PDAP?
Det er en datakube som lagrer data som et sammendrag. Det hjelper brukeren med å analysere data raskt. Dataene i PDAP er lagret på en måte som rapportering kan gjøres med letthet.
24) Forklar databasedesign for snøflakskjema
Et snøfnuggskjema er en ordning av et dimensjonstabell og faktabord. Generelt er begge bordene videre delt inn i flere dimensjonstabeller.
25) Forklar analysetjeneste
Analysetjeneste gir en kombinert oversikt over dataene som brukes i data mining eller OLAP.
26) Hva er sekvensklusteringsalgoritme?
Sekvensklyngealgoritme samler baner som er like eller relaterte til hverandre og sekvenser av data som har hendelser.
27) Hva er diskrete og kontinuerlige data?
Diskrete data er endelige data eller definerte data. F.eks. Kjønn, telefonnummer. Kontinuerlige data er data som endres kontinuerlig og ordnet. F.eks alder.
28) Hva er tidsseriealgoritmen?
Tidsseriealgoritme er en metode for å forutsi kontinuerlige verdier av data i tabellen. F.eks. Ytelse en ansatt kan forutsi fortjeneste eller innflytelse.
29) Hva er Business Intelligence?
BI (Business Intelligence) er et sett med prosesser, arkitekturer og teknologier som konverterer rådata til meningsfull informasjon som driver lønnsomme forretningshandlinger. Det er en serie med programvare og tjenester for å transformere data til handlingsbar intelligens og kunnskap.
30) Hva er bit kartlagt indeks?
Bitmap-indekser er en spesiell type databaseindeks som bruker bitmaps (bit arrays) for å svare på spørsmål ved å utføre bitvise operasjoner.
31) Forklar datalagring i detalj
Datalager er en prosess for å samle inn og administrere data fra forskjellige kilder. Det gir meningsfull innsikt i virksomheten. Datalager brukes vanligvis til å koble til og analysere data fra heterogene kilder. Det er kjernen i BI-systemet, som er bygget for dataanalyse og rapportering.
32) Hva er søppeldimensjon?
Søppeldimensjon kombinerer to eller flere relaterte kardinaliteter i en dimensjon. Det er vanligvis boolske verdier eller flaggverdier.
33) Forklar dataskjema
Data Scheme er en skjematisk fremstilling som illustrerer dataforhold og strukturer.
34) Forklar frekvens for datainnsamling
Datainnsamlingsfrekvensen er frekvensen for å samle inn dataene. Det går også gjennom forskjellige stadier. Disse trinnene er: 1) ekstrahering fra forskjellige kilder, 3) transformering, 4) rensing og 5) lagring.
35) Hva er databasekardinalitet?
Kardinalitet er en numerisk attributt for forholdet mellom to enheter eller enhetssett.
36) Hva er de forskjellige typene av hovedforhold?
Ulike typer viktige kardinalforhold er:
- En-til-en-forhold
- En-til-mange forhold
- Mange-til-en-forhold
- Mange-til-mange-forhold
37) Definer kritisk suksessfaktor og list opp de fire typene
Critical Success Factor er et gunstig resultat av enhver aktivitet som er nødvendig for at organisasjonen skal nå sitt mål.
Fire typer kritisk suksessfaktor er:
- Industrielle CSF-er
- Strategi CSFer
- Miljømessige CSF-er
- Temporal CSFs
38) Hva er data mining?
Data mining er en tverrfaglig ferdighet som bruker maskinlæring, statistikk, AI og databaseteknologi. Det handler om å oppdage intetanende / tidligere ukjente forhold mellom dataene.
39) Hva er forskjellen mellom stjerneskjema og snøfnuggskjema?
Stjerneskjema | Snøfnuggskjema |
Hierarkier for dimensjonene er lagret i dimensjonstabellen. | Hierarkier er delt inn i separate tabeller. |
Den inneholder en faktatabell omgitt av dimensjonstabeller. | Ett faktatabell omgitt av dimensjonstabell som igjen er omgitt av dimensjonstabell |
I et stjerneskjema oppretter bare en enkelt sammenføyning forholdet mellom faktatabellen og dimensjonstabeller. | Et snøfnuggskjema krever mange sammenføyninger for å hente dataene. |
Den har en enkel databasedesign | Den har en kompleks databasedesign |
Denormalisert datastruktur og spørring kjører også raskere. | Normalisert datastruktur. |
Høyt nivå av dataredundans | Veldig lavt nivå data redundans |
Tilbyr spørsmål med høyere ytelse ved bruk av Star Join Query Optimization. Tabeller kan være forbundet med flere dimensjoner. | Snow Flake Schema er representert av en sentralisert faktatabell som sannsynligvis ikke er forbundet med flere dimensjoner. |
40) Hva er identifiserende forhold?
Identifisering av enhetsrelasjoner i DBMS brukes til å identifisere et forhold mellom to enheter: 1) sterk enhet og 2) svak enhet.
41) Hva er et selvrekursivt forhold?
Rekursivt forhold er en frittstående kolonne i en tabell som er koblet til hovednøkkelen til den samme tabellen.
42) Forklar relasjonsdatamodellering
Relasjonsdatamodellering er representasjon av objekter i en relasjonsdatabase, som vanligvis normaliseres.
43) Hva er prediktiv modelleringsanalyse?
Prosessen med å validere eller teste en modell som kan brukes til å forutsi testing og validering av resultater. Den kan brukes til maskinlæring, kunstig intelligens, samt statistikk.
44) Hva er forskjellen mellom logisk datamodell og fysisk datamodell?
Logisk datamodell | Fysisk datamodell |
En logisk datamodell kan utforme kravet til virksomhet logisk. | En fysisk datamodell gir informasjon om måldatabasekilden og dens egenskaper. |
Det er ansvarlig for den faktiske implementeringen av data som er lagret i databasen. | En fysisk datamodell hjelper deg med å lage en ny databasemodell fra eksisterende og bruke begrensningen for referanseintegritet. |
Den inneholder en enhet, primære nøkkelattributter, Inversjonsnøkler, alternativ nøkkel, regel, forretningsforhold, definisjon, etc. | En fysisk datamodell inneholder en tabell, nøkkelbegrensninger, unik nøkkel, kolonner, fremmednøkkel, indekser, standardverdier, etc. |
45) Hva er de forskjellige typene begrensninger?
En annen type begrensning kan være unik, nullverdier, fremmednøkler, sammensatt nøkkel eller sjekkbegrensning, etc.
46) Hva er et datamodelleringsverktøy?
Datamodelleringsverktøy er en programvare som hjelper til med å konstruere dataflyt og forholdet mellom data. Eksempler på slike verktøy er Borland Together, Altova Database Spy, casewise, Case Studio 2, etc.
47) Hva er hierarkisk DBMS?
I den hierarkiske databasen er modelldata organisert i en trelignende struktur. Data lagres i et hierarkisk format. Data er representert ved hjelp av et foreldre-barn forhold. I hierarkisk DBMS kan foreldre ha mange barn, barn har bare en forelder.
48) Hva er ulempene med den hierarkiske datamodellen?
Ulempene med den hierarkiske datamodellen er:
- Det er ikke fleksibelt, da det tar tid å tilpasse seg de skiftende behovene til virksomheten.
- Strukturen stiller spørsmål i inter-avdelingskommunikasjon, vertikal kommunikasjon, samt kommunikasjon mellom byråer.
- Hierarkisk datamodell kan skape problemer med uenighet.
49) Forklar den prosessdrevne tilnærmingen til datamodellering
Prosessdrevet tilnærming brukt i datamodellering følger trinnvis metode for forholdet mellom enhetsforholdsmodellen og organisasjonsprosessen.
50) Hva er fordelene med å bruke datamodellering?
Fordelene med å bruke datamodellering i datalagring er:
- Det hjelper deg med å administrere forretningsdata ved å normalisere dem og definere attributtene.
- Datamodellering integrerer dataene til forskjellige systemer for å redusere dataredundans.
- Det muliggjør effektiv databasedesign.
- Datamodellering hjelper organisasjonsavdelingen å fungere som et team.
- Det gjør det enkelt å få tilgang til data.
51) Hva er ulempene ved å bruke datamodellering?
Ulempene ved å bruke datamodellering er:
- Den har mindre strukturell uavhengighet
- Det kan gjøre systemet komplisert.
52) Hva er indeks?
Indeks brukes til en kolonne eller gruppe av kolonner for å hente data raskt.
53) Hva kjennetegner en logisk datamodell?
Kjennetegn ved logisk datamodell er:
- Beskriver databehov for et enkelt prosjekt, men kan integreres med andre logiske datamodeller basert på omfanget av prosjektet.
- Designet og utviklet uavhengig av DBMS.
- Dataattributter vil ha datatyper med nøyaktige presisjoner og lengde.
- Normaliseringsprosesser til modellen, som vanligvis brukes vanligvis til 3NF.
54) Hva kjennetegner den fysiske datamodellen?
Kjennetegn ved fysisk datamodell er:
- Den fysiske datamodellen beskriver databehov for et enkelt prosjekt eller applikasjon. Den kan integreres med andre fysiske datamodeller basert på prosjektomfang.
- Datamodellen inneholder forhold mellom tabeller som adresserer kardinaliteten og nulliteten til forholdene.
- Utviklet for en spesifikk versjon av en DBMS, plassering, datalagring eller teknologi som skal brukes i prosjektet.
- Kolonner skal ha eksakte datatyper, tildelte lengder og standardverdier.
- Primære og utenlandske nøkler, visninger, indekser, tilgangsprofiler og autorisasjoner osv. Er definert.
55) Hva er de to typene datamodelleringsteknikker?
To typer datamodelleringsteknikker er: 1) enhetsrelasjonsmodell (ER) og 2) UML (Unified Modeling Language).
56) Hva er UML?
UML (Unified Modelling Language) er et generelt språk, databasesystem, modelleringsspråk innen programvareteknikk. Hovedintensjonen er å gi en generalisert måte å visualisere systemdesign på.
57) Forklar objektorientert databasemodell
Den objektorienterte databasemodellen er en samling objekter. Disse objektene kan ha tilhørende funksjoner så vel som metoder.
58) Hva er en nettverksmodell?
Det er en modell som er bygget på hierarkisk modell. Det tillater mer enn ett forhold å koble poster, noe som indikerer at det har flere poster. Det er mulig å lage et sett med foreldreposter og underordnede poster. Hver post kan tilhøre flere sett som lar deg utføre komplekse tabellforhold.
59) Hva er hashing?
Hashing er en teknikk som brukes til å søke i hele indeksverdien og hente inn ønskede data. Det hjelper å beregne den direkte plasseringen av data, som er registrert på disken uten å bruke indeksens struktur.
60) Hva er forretnings- eller naturlige nøkler?
forretnings- eller naturlige nøkler er et felt som unikt identifiserer en enhet. For eksempel klient-ID, ansattnummer, e-post etc.
61) Hva er sammensatt nøkkel?
Når mer enn ett felt brukes til å representere en nøkkel, blir det referert til som en sammensatt nøkkel.
62) Hva er den første normale formen?
Første normale form eller 1NF er en egenskap for en relasjon som er tilgjengelig i et relationsdatabasesystem. Enhver relasjon kalles første normale form hvis domenet til hvert attributt inneholder atomverdier. Den inneholder en verdi fra det domenet.
63) Hva er forskjellen mellom primærnøkkel og fremmednøkkel?
Primærnøkkel | Utenlandsk nøkkel |
Primærnøkkel hjelper deg med å identifisere en post i tabellen. | Fremmednøkkel er et felt i tabellen som er hovednøkkelen til en annen tabell. |
Primærnøkkel godtar aldri nullverdier. | En fremmed nøkkel kan akseptere flere nullverdier. |
Primærnøkkel er en klynget indeks, og data i DBMS-tabellen er fysisk organisert i sekvensen til den klyngede indeksen. | En utenlandsk nøkkel kan ikke automatisk opprette en indeks, gruppert eller ikke-gruppert. Du kan imidlertid opprette en indeks manuelt på den utenlandske nøkkelen. |
Du kan ha den eneste primære nøkkelen i en tabell. | Du kan ha flere utenlandske nøkler i en tabell. |
64) Hva er kravene til den andre normale formen?
Kravene til den andre normale formen er:
- Det skal være i første normale form.
- Den inneholder ikke noe ikke-primær-attributt, som funksjonelt er avhengig av noen undersett av kandidatnøkkelen til tabellrelasjonen.
65) Hva er reglene for tredje normalform?
Regler for tredje normale former er:
- Det skal være i andre normale form
- Den har ingen overgangsfunksjonelle avhengigheter.
66) Hva er viktigheten av å bruke nøkler?
- Taster hjelper deg med å identifisere hvilken som helst rad med data i en tabell. I en applikasjon fra den virkelige verden kan en tabell inneholde tusenvis av poster.
- Tastene sørger for at du unikt kan identifisere en tabellpost til tross for disse utfordringene.
- Lar deg etablere et forhold mellom og identifisere forholdet mellom tabeller
- Hjelp deg med å håndheve identitet og integritet i forholdet.
67) Hva er en surrogatnøkkel?
En kunstig nøkkel som tar sikte på å identifisere hver plate unikt, kalles en surrogatnøkkel. Disse nøklene er unike fordi de er opprettet når du ikke har noen naturlig primærnøkkel. De gir ingen betydning for dataene i tabellen. Surrogatnøkkel er vanligvis et helt tall.
68) Forklar alternativ nøkkel i detalj
Alternativ nøkkel er en kolonne eller gruppe av kolonner i en tabell som unikt identifiserer hver rad i den tabellen. En tabell kan ha flere valg for en primærnøkkel, men bare en kan angis som primærnøkkel. Alle nøklene som ikke er primærnøkkel kalles en alternativ nøkkel.
69) Hva er fjerde normalform i DBMS?
Fjerde normalform er et nivå av database normalisering der det ikke må ha annen triviell avhengighet enn kandidatnøkkel.
70) Hva er et databasestyringssystem?
Database management system eller DBMS er en programvare for lagring og henting av brukerdata. Den består av en gruppe programmer som manipulerer databasen.
71) Hva er regelen om femte normalform?
Et bord er i 5 th normale form når det er i 4 th normal form, og det kan ikke deles opp i en rekke mindre bord uten tap av data.
72) Hva er normalisering?
Normalisering er en databasedesignteknikk som organiserer tabeller på en måte som reduserer redundans og avhengighet av data. Den deler større tabeller i mindre tabeller og kobler dem ved hjelp av relasjoner.
73) Forklar egenskapene til et databasesystem
- Gir sikkerhet og fjerner overflødighet
- Selvbeskrivende databasesystemets natur
- Isolasjon mellom programmer og dataabstrahering
- Støtte for flere visninger av data.
- Deling av data og behandling av flere brukere
- DBMS lar enheter og relasjoner mellom dem danne tabeller.
- Den følger ACID-konseptet (Atomicitet, Konsistens, Isolasjon og Holdbarhet).
- DBMS støtter et flerbrukermiljø som lar brukerne få tilgang til og få tilgang til og manipulere data parallelt.
74) Liste over populær DBMS-programvare
Populær DBMS-programvare er:
- MySQL
- Microsoft Access
- Oracle
- PostgreSQL
- dbase
- FoxPro
- SQLite
- IBM DB2
- Microsoft SQL Server.
75) Forklar begrepet RDBMS
Relational Database Management System er en programvare som brukes til å lagre data i form av tabeller. I denne typen system administreres og lagres data i rader og kolonner, som er kjent som tupler og attributter. RDBMS er et kraftig datastyringssystem og brukes mye over hele verden.
76) Hva er fordelene med datamodell?
Fordelene med datamodellen er:
- Hovedmålet med en designende datamodell er å sikre at dataobjekter som tilbys av det funksjonelle teamet er representert nøyaktig.
- Datamodellen skal være detaljert nok til å brukes til å bygge den fysiske databasen.
- Informasjonen i datamodellen kan brukes til å definere forholdet mellom tabeller, primære og utenlandske nøkler og lagrede prosedyrer.
- Data Model hjelper bedrifter å kommunisere innen og på tvers av organisasjoner.
- Datamodell hjelper til med å dokumentere datakartinger i ETL-prosessen
- Hjelp til å gjenkjenne riktige datakilder for å fylle ut modellen
77) Hva er ulempene med datamodell?
Ulemper med datamodellen er:
- For å utvikle datamodellen, bør man kjenne fysiske datalagrede egenskaper.
- Dette er et navigasjonssystem som produserer kompleks applikasjonsutvikling, administrasjon. Dermed krever det kunnskap om den biografiske sannheten.
- Enda mindre endringer i strukturen krever endringer i hele applikasjonen.
- Det er ikke noe sett med databehandlingsspråk i DBMS.
78) Forklar forskjellige typer faktatabeller
Det er tre typer faktatabeller:
- Tilsetningsstoff: Det er et mål som legges til enhver dimensjon.
- Ikke-additiv: Det er et mål som ikke kan legges til noen dimensjon.
- Halvadditiv: Det er et mål som kan legges til noen få dimensjoner.
79) Hva er aggregattabell?
Aggregattabellen inneholder aggregerte data som kan beregnes ved hjelp av funksjoner som: 1) Gjennomsnitt 2) MAKS, 3) Antall, 4) SUM, 5) SUM og 6) MIN.
80) Hva er bekreftet dimensjon?
En tilpasset dimensjon er en dimensjon som er utformet på en måte som kan brukes på tvers av mange faktatabeller i forskjellige områder av et datalager.
81) Liste over typer hierarkier i datamodellering
Det er to typer hierarkier: 1) Nivåbaserte hierarkier og 2) Foreldre-barn-hierarkier.
82) Hva er forskjellen mellom et datamart og datalager?
Databutikk | Datavarehus |
Data mart fokuserer på et enkelt fagområde. | Datalager fokuserer på flere forretningsområder. |
Den brukes til å ta taktiske beslutninger for forretningsvekst. | Det hjelper bedriftseiere å ta en strategisk beslutning |
Data mart følger modellen nedenfra og opp | Datalager følger en top-down-modell |
Datakilde kommer fra én datakilde | Datakilde kommer fra mer enn en heterogen datakilde. |
83) Hva er XMLA?
XMLA er en XML-analyse som anses som standard for tilgang til data i Online Analytical Processing (OLAP).
84) Forklar søppeldimensjon
Søppeldimensjon hjelper til med å lagre data. Den brukes når data ikke er riktig å lagre i skjema.
85) Forklar lenket datareplikering
Situasjonen når en sekundær node velger mål ved hjelp av pingtid eller når den nærmeste noden er en sekundær, kalles den som lenket datareplikering.
86) Forklar virtuell datalagring
Et virtuelt datalager gir et samlet bilde av de fullførte dataene. Et virtuelt datalager har ikke historiske data. Det regnes som en logisk datamodell som har metadata.
87) Forklar øyeblikksbilde av datalageret
Snapshot er en fullstendig visualisering av data på det tidspunktet datautvinningsprosessen begynner.
88) Hva er et toveis ekstrakt?
Systemets evne til å trekke ut, rense og overføre data i to retninger kalles et retningsekstrakt.