Normalizer er en aktiv transformasjon som brukes til å konvertere en enkelt rad til flere rader og omvendt. Det er en smart måte å representere dataene dine på en mer organisert måte.
Hvis det i en enkelt rad er gjentatte data i flere kolonner, kan de deles i flere rader. Noen ganger har vi data i flere kolonner som forekommer. For eksempel
Student navn | Klasse 9-poengsum | Klasse 10-poengsum | Klasse 11 Score | Klasse 12-poengsum |
Student 1 | 50 | 60 | 65 | 80 |
Student 2 | 70 | 64 | 83 | 77 |
I dette tilfellet gjentas klassescore-kolonnen i fire kolonner. Ved hjelp av normalisering kan vi dele disse i følgende datasett.
Student navn | Klasse | Resultat |
Student 1 | 9 | 50 |
Student 1 | 10 | 60 |
Student 1 | 11 | 65 |
Student 1 | 12 | 80 |
Student 2 | 9 | 70 |
Student 2 | 10 | 64 |
Student 2 | 11 | 83 |
Student 2 | 12 | 77 |
Trinn 1 - Opprett kildetabell "salgskilde" og måltabell "salg_mål" ved hjelp av skriptet og importer dem i Informatica
Last ned Sales_Source.txt-filen ovenfor
Trinn 2 - Opprett en kartlegging som har kilden "sales_source" og måltabellen "sales_target"
Trinn 3 - Opprett en ny transformasjon fra transformasjonsmenyen
- Velg normalisering som transformasjon
- Skriv inn navnet "nrm_sales"
- Velg Opprett alternativ
Trinn 4 - Transformasjonen vil bli opprettet, velg alternativet ferdig
Trinn 5 - Dobbeltklikk på normaliseringstransformasjonen, deretter
- Velg normaliseringsfanen
- Klikk på ikonet for å opprette to kolonner
- Skriv inn kolonnenavn
- Sett antall forekomster til 4 for salg og 0 for butikkens navn
- Velg OK-knappen
Kolonner genereres i transformasjonen. Du vil se 4 antall salgskolonner når vi setter antall forekomster til 4.
Trinn 6 - Så i kartleggingen
- Koble de fire kolonnene til kildekvalifiseringen i de fire kvartalene til henholdsvis normaliseringskolonnene.
- Koble butikkens navnekolonne til normaliseringskolonnen
- Koble butikknavn og salgskolonner fra normalisering til måltabellen
- Koble GK_sales-kolonnen fra normalisering til måltabellen
Lagre kartleggingen og kjør den etter å ha opprettet økt og arbeidsflyt. For hvert kvartals salg av en butikk vil det opprettes en egen rad ved normaliseringstransformasjonen.
Resultatet av kartleggingen vår vil være som -
Butikknavn | Fjerdedel | Salg |
DELHI | 1 | 150 |
DELHI | 2 | 240 |
DELHI | 3 | 455 |
DELHI | 4 | 100 |
MUMBAI | 1 | 100 |
MUMBAI | 2 | 500 |
MUMBAI | 3 | 350 |
MUMBAI | 4 | 340 |
Kildedataene hadde gjentatte kolonner, nemlig QUARTER1, QUARTER2, QUARTER3 og QUARTER4. Ved hjelp av normalisering har vi omorganisert dataene slik at de passer inn i en enkelt kolonne med KVARTAL, og for en kildepost opprettes fire poster i målet.
På denne måten kan du normalisere data og opprette flere poster for en enkelt datakilde.