SAP DS (Data Services) i HANA

Anonim

Hva er SAP-datatjenester?

SAP Data services er et ETL-verktøy som gir en enkelt bedriftsnivåløsning for dataintegrering, transformasjon, datakvalitet, dataprofilering og tekstdata behandling fra den heterogene kilden til en måldatabase eller datalager.

Vi kan lage applikasjoner (jobb) der datakartlegging og transformasjon kan gjøres ved hjelp av Designer. (Siste versjon av SAP BODS er 4.2).

Funksjoner av datatjenester

  • Det gir parallelle transformasjoner med høy ytelse.
  • Den har omfattende administrative verktøy og rapporteringsverktøy.
  • Den støtter flere brukere.
  • SAP BODS er veldig fleksibelt med nettbasert applikasjon.
  • Det tillater skriptspråk med rike sett med funksjoner.
  • Datatjenester kan integreres med SAP LT Replication Server (SLT), med

    Utløserbasert teknologi. SLT legger til delta-evner til alle SAP- eller ikke-SAP-kildetabeller

    Som tillater bruk av datafangst for endring og overføring av delta-data til

    kildetabellen.

  • Datavalidering med dashbord og prosessrevisjon.
  • Administrasjonsverktøy med planleggingsmuligheter og overvåking / dashboards.
  • Feilsøking og innebygd profilering og visning av data.
  • SAP BODS støtter bred kilde og mål.
    • Eventuelle applikasjoner (f.eks. SAP).
    • Eventuelle databaser med masseinnlasting og endring av datafangst
    • Filer: fast bredde, komma avgrenset, COBOL, XML, Excel.

Komponent av datatjenester

SAP DATA-tjenester har komponenten nedenfor -

  1. Designer - Det er et utviklingsverktøy der vi kan opprette, teste og utføre en jobb som fyller et datalager.

    Det lar utvikleren lage objekter og konfigurere dem ved å velge et ikon i et kilde-til-mål-flytdiagram.

    Den kan brukes til å lage en applikasjon ved å spesifisere arbeidsflyter og datastrømmer.

    For å åpne Data Service Designer, gå til Start-menyen -> Alle programmer -> SAP Data Services (4.2 her) -> Data Service Designer.

  1. Job Server - Det er et program som starter datatjenestebehandlingsmotoren og fungerer som et grensesnitt til motoren og Data Services Suite.
  2. Engine- Data Service-motor utfører individuelle jobber som er definert i applikasjonen.
  3. Repository - Repository er en database som lagrer designerdefinerte objekter og brukerdefinerte objekter (kilde- og målmetadata, transformasjonsregler).

    Datalager er av to typer -

  • Local Repository (brukes av Designer og Job Server).
  • Central Repository (brukes til objektdeling og versjonskontroll)
  1. Access Server - Access server overfører meldinger mellom webapplikasjoner, datatjenester jobbserver og motorer.
  2. Administrator - Webadministrator gir nettleserbasert administrasjon av datatjenestens ressursdetaljer som nedenfor -
  • Konfigurere, starte og stoppe sanntidstjenester.
  • Planlegge, overvåke og utføre batchjobber.
  • Konfigurere bruk av jobbserver, tilgangsserver og lager.
  • Administrere brukere.
  • Publisering av batchjobber og sanntidstjenester via webtjenester
  • Konfigurere og administrere adaptere.

Datatjenestearkitektur -

Datatjenestearkitektur har følgende komponent-

  • Central Repository - det brukes til lagringskonfigurasjoner til jobbservere, sikkerhetsadministrasjon, versjonskontroll og objektdeling
  • Designer - brukes til å lage prosjekt, jobb, arbeidsflyt, dataflyt og kjøring.
  • Lokalt depot (her kan du opprette endrings- og startjobber, arbeidsflyt, dataflyt).
  • Jobbserver og motor - Den administrerer jobbene.
  • Access Server - Den brukes til å utføre sanntidsjobber opprettet av utviklere i repositoriene.

I bildet nedenfor vises datatjenester og komponentforholdet.

SAP BODS-arkitektur

Designer Window Detail: Først ser vi på den første komponenten i SAP datatjeneste - Designer

Detaljene for hver del av datatjenestedesigneren er som nedenfor -

  1. Verktøylinje (brukes til Åpne, Lagre, Tilbake, Valider, Utfør osv.).
  2. Prosjektområde (Inneholder det nåværende prosjektet, som inkluderer jobb, arbeidsflyt og dataflyt. I datatjenester er alle enheter objekter.
  3. Arbeidsplass (applikasjonsvinduområdet der vi definerer, viser og endrer objekter).
  4. Lokalt objektbibliotek (Den inneholder lokale arkivobjekter, som transformasjoner, jobb, arbeidsflyt, dataflyt, etc.).
  5. Tool Palette (Knapper på verktøypaletten lar deg legge til nye objekter i arbeidsområdet).

Objekthierarki

Diagrammet nedenfor viser hierarkiske forhold for de viktigste objekttypene i Data Services.

>

Merk:

Arbeidsflyter og Betinget * er valgfritt

Objekter som brukes i SAP-datatjenestedetaljer er som nedenfor -

Objekter Beskrivelse
Prosjekt Et prosjekt er et objekt på høyeste nivå i Designer-vinduet. Prosjekter gir deg en måte å organisere de andre objektene du lager i Data Services. Bare ett prosjekt er åpent om gangen (der "åpen" betyr "synlig i prosjektområdet").
Jobb En "jobb" er den minste arbeidsenheten du kan planlegge uavhengig av forex.
Skript En delmengde av linjer i en prosedyre.
Arbeidsflyt En "arbeidsflyt" er inkorporering av flere datastrømmer i en sammenhengende arbeidsflyt for en hel jobb. Arbeidsflyt er valgfritt. Arbeidsflyt er en prosedyre.
  • Anropsdata flyter
  • Ring en annen arbeidsflyt
  • Definer rekkefølgen på trinnene som skal utføres i jobben din
  • Gi parametere til og fra datastrømmer.
  • Spesifiser hvordan du skal håndtere feil som oppstår under kjøring.
  • Definer vilkår for gjennomføring av deler av prosjektet.
Dataflyt En "datastrøm" er prosessen der kildedata transformeres til måldata. En datastrøm er et gjenbrukbart objekt. Det kalles alltid fra en arbeidsflyt eller en jobb.
  • Identifiser kildedataene du vil lese.
  • Definer transformasjonene du vil utføre på dataene.
  • Identifiser måltabellen du vil laste data til.
Datalager Logisk kanal som kobler datatjenester til kilde- og datastore-måldatabaser.
  • Må spesifiseres for hver kilde og måldatabase.
  • Brukes til å importere metadata for kilde- og måldatabaser til depotet
  • Brukes av Data Services for å lese data fra kildetabeller og laste datato-måltabeller
Mål Tabell eller fil der Data Services laster inn data fra kilden.

Eksempel på datatjenester etter lastedata fra SAP-kildetabellen

Alt i datatjenester er et objekt. Vi må skille datalager for hver kilde og måldatabase.

Trinn for å laste inn data fra SAP-kildetabellen - SAP BODS har mange trinn, der vi trenger å opprette et datalager for kilde og mål og tilordne dem.

  • Opprett datalager mellom kilde og BODS
  • Importer metadataene (strukturer) til BODS.
  • Konfigurer importserver
  • Importer metadataene til HANA-systemet.
  • Opprett datalager mellom BODS til HANA.
  • Lag prosjekt.
  • Opprett jobb (batch / sanntid)
  • Lag arbeidsflyt
  • Opprett dataflyt
  • Legg til objekt i dataflyt
  • Utfør jobben
  • Sjekk forhåndsvisning av data i HANA

Trinn 1) Opprett datalager mellom SAP Source og BODS

  1. For å laste data fra SAP-kilde til SAP HANA gjennom SAP BODS, trenger vi en datalager. Så vi oppretter en datalager først som vist nedenfor -

    Prosjekt -> Ny -> Datalager

  2. En popup vises for Opprett ny datalager, skriv inn detaljene som nedenfor -
    1. Skriv inn datalagernavnet "ds_ecc".
    2. Velg Datalagertypenavn som "SAP-applikasjoner".
    3. Skriv inn databaseservernavnet
    4. Brukernavn og passord.
    5. Klikk på "Apply" -knappen.
    6. Klikk på "OK" -knappen.

  3. Datalager blir opprettet og viser den opprettede datalageret som nedenfor -
  1. Gå til biblioteket for lokale objekter
  2. Velg DataStore-fanen.
  3. Datalageret "ds_ecc" vises.

Trinn 2) Importer metadata (struktur) til BODS Server.

Vi har opprettet et datalager for ECC to BODS; nå importerer vi metadata fra ECC til BODS. Følg trinnene nedenfor for å importere -

  1. Velg Datastore "ds_ecc" og høyreklikk.
  2. Velg alternativet Importer etter navn.

    En popup vises for Importer etter navn. Skriv inn detaljer som nedenfor -

    1. Velg Type som en tabell.
    2. Skriv inn navnet på tabellen, som vi vil importere. Her importerer vi KNA1-tabellen.
    3. Klikk på "Importer" -knappen. KNA1-tabellen vises under tabellnoden til "ds_ecc" -datakilden.

Tabellmetadata blir importert, i datalageret ds_ecc som nedenfor -

Trinn 3) Konfigurer importserver

Til nå har vi importert tabell til data lagret "ds_ecc" opprettet for ECC til SAP BODS Connection. For å importere data til SAP HANA, må vi konfigurere Import server,

  1. For å gjøre dette, gå til Hurtigvisning-> Konfigurer importserver som nedenfor -

  2. En popup for Velg system vises, Velg SAP HANA (HDB her) System som nedenfor-

  1. Klikk på "Neste" -knappen. En annen forgrunnsvindu for legitimasjon for datatjenester vises, skriv inn følgende detaljer
  1. SAP BODS serveradresse (her BODS: 6400)
  2. Skriv inn SAP BODS Repository Name (HANAUSER Repositery Name)
  3. Angi ODBC-datakilde (ZTDS_DS).
  4. Angi standardport for SAP BODS-server (8080).

Klikk på "Fullfør" -knappen.

Trinn 4) Importer metadataene til HANA System

1. Til nå har vi konfigurert Import Server, nå importerer vi metadata fra SAP BODS server.

  1. Klikk Importer alternativet i Hurtigvisning.
  2. Et popup-vindu for alternativet Importer vises. Velg alternativet "Selektiv import av metadata".

Klikk på "Neste" -knappen.

2. En popup for "Selektiv import av metadata" vises, der vi velger målsystem.

  1. Velg SAP HANA System (HDB her).

Klikk på "Neste" -knappen.

Trinn 5) Opprett datalager mellom BODS og HANA

Som vi vet, må vi i BODS lage en egen datalager for kilde og mål. Vi har allerede opprettet en datalager for kilden, nå må vi opprette en datalager for målet (mellom BODS og HANA). Så vi oppretter en ny datalager med navnet "DS_BODS_HANA".

  1. Gå til Prosjekt -> Ny -> Datalager.

  1. Et skjermbilde for Create new Datastore vises som nedenfor.
    1. Skriv inn datalagernavnet (DS_BODS_HANA).
    2. Skriv inn datalagringstype som database.
    3. Skriv inn databasetype som SAP HANA.
    4. Velg databaseversjon.
    5. Skriv inn navnet på SAP HANA-databaseserveren.
    6. Skriv inn portnavn for SAP HANA-database.
    7. Skriv inn brukernavn og passord.
    8. Kryss av for "Aktiver automatisk dataoverføring".

Klikk på "Apply" og deretter "OK" -knappen.

Datalageret "DS_BODS_HANA" vil vises under datalagringsfanen i Local Object Library som

Under-

  1. Nå importerer vi tabellen i datalageret "DS_BODS_HANA".
    1. Velg datalager "DS_BODS_HANA" og høyreklikk.
    2. Velg Importer etter navn.

  1. En forgrunnsvindu for Importer etter navn vil vises som nedenfor -
    1. Velg Type som tabell.
    2. Skriv inn navn som KNA1.
    3. Eieren vises som Hanauser.
    4. Klikk på Importer-knapp.

Tabellen vil bli importert i "DS_BOD_HANA" datalager, for å se data i tabellen, følg trinnene nedenfor -

  1. Klikk på tabellen "KNA1" i datalageret "DS_BODS_HANA".
  2. Data vises i TABELLAR Format.

Trinn 6) Definer prosjekt: Prosjektgruppe og organisere relaterte objekter. Prosjektet kan inneholde et hvilket som helst antall jobber, arbeidsflyt og dataflyt.

  1. Gå til Designer Project-menyen.
  2. Velg nytt alternativ.
  3. Velg prosjektalternativ.

En POP-UP for ny prosjektoppretting vises som nedenfor. Skriv inn prosjektnavn og klikk på Opprett-knapp. Det vil opprette en prosjektmappe i vårt tilfelle BODS_DHK.

Trinn 7) Definer jobb: En jobb er et gjenbrukbart objekt. Den inneholder arbeidsflyter og dataflyt. Jobber kan utføres manuelt eller som en tidsplan. For å utføre BODS-prosessen må vi definere jobben.

Vi oppretter en jobb som JOB_Customer.

  1. Velg prosjekt (BODS_DHK) opprettet i trinn 1, høyreklikk og velg "Ny batchjobb".

  2. Gi den nytt navn til "JOB_Customer".

Trinn 8) Definer arbeidsflyt:

  1. Velg jobb "JOB_Customer" i prosjektområdet,
  2. Klikk på arbeidsflytknappen på verktøypaletten. Klikk på Black Workspace-området. Et arbeidsflytikon vises i arbeidsområdet.
  3. Endre navnet på arbeidsflyten som "WF_Customer".

Klikk på navnet på arbeidsflyten, en tom visning for arbeidsflyten vises i arbeidsområdet.

Trinn 9) Definer dataflyt:

  1. Klikk på arbeidsflyt "WF_Customer".
  2. Klikk Dataflyt-knappen på verktøypaletten. Klikk på Black Workspace-området. Et dataflytikon vises i arbeidsområdet.
  3. Endre navnet på dataflyten som "DF_Customer".
  4. Dataflyten vises også i prosjektområdet til venstre under stillingsnavn.

Trinn 10) Legg til objekt i dataflyt:

Inne i dataflyten kan vi gi instruksjoner om å transformere kildedata til ønsket form for måltabellen.

Vi vil se objektet nedenfor -

  • Et objekt for kilden.
  • Et objekt for måltabellen.
  • Et objekt for spørringstransformasjon. (Spørringstransformasjon kartlegger kolonnene fra kilde til mål.)

    Klikk på dataflyten DF_Customer. Et tomt arbeidsområde vises som nedenfor -

  1. Spesifiser objekt fra kilde - Gå til Datalager "ds_ecc" og velg tabell KNA1 og dra og slipp til datastrømmen tom skjerm som nedenfor skjerm-
  2. Spesifiser objekt for Target- Velg datalager "DS_BODS_HANA" fra depotet og velg tabellen KNA1.
  3. Dra og slipp til arbeidsområdet og velg alternativet "Lag mål". Det vil være to tabeller for kilde og mål. Her vil vi definere tabellen som kilde og mål.

  1. Spørringstransformasjon - Dette er et verktøy som brukes til å hente data basert på inndataskjema for brukerspesifikk tilstand og for transportdata fra kilde til mål.
    1. Velg ikonet Query Transform fra verktøypaletten, og dra og slipp det mellom kilde og målobjekt i arbeidsområdet som nedenfor -
    2. Koble spørringsobjekt til kilde.
    3. Koble spørringsobjekt til måltabellen.

    1. Dobbeltklikk på spørringsikonet. Ved dette kartlegger vi en kolonne fra inngangsskjema til utgangsskjema.

Når vi klikker på spørringsikonet, vises et neste vindu for kartlegging der vi gjør følgende trinn -

  1. Kildetabell KNA1 er valgt.
  2. Velg hele kolonnen fra kildetabellen, og høyreklikk og velg et kart som skal sendes ut.
  3. Målutgang valgt som spørring, og kolonne blir kartlagt.

5. Lagre og valider prosjektet.

1. Klikk på valider Ikon.

2. Det vises en forgrunnsvindu for validering.

Trinn 11) Utfør jobb - For å utføre jobb, følg stien nedenfor-

  1. Velg ikonet Prosjektområde for å åpne Prosjekt, og velg opprettet prosjekt.
  2. Velg Jobb og høyreklikk.
  3. Velg Utfør alternativ for å utføre jobb.

    1. Etter å ha utført jobb vises et jobbloggvindu der all melding om jobb vises.
    2. Den siste meldingen er Job <> er fullført.

    Trinn 12) - Valider / kontroller data i SAP HANA-databasen.

    1. Logg deg på SAP HANA-databasen via SAP HANA Studio, og velg HANAUSER-skjema.
    2. Velg KNA1-tabell i tabellnode.
    3. Høyreklikk på tabellen KNA1 og velg Open Data Preview.
    4. Tabell (KNA1) Data som er lastet inn av BODS-prosesser som ovenfor, vises i skjermbildet for forhåndsvisning av data.