Origine batch della tabella SAP

Questa pagina descrive come configurare le estrazioni collettive dai dati delle applicazioni SAP.

Il plug-in di origine batch della tabella SAP (plug-in della tabella SAP) consente di leggere i dati dalle tabelle o dalle viste standard e personalizzate di SAP. Consente l'importazione collettiva dei dati dalle applicazioni SAP in BigQuery o in qualsiasi altro sistema di destinazione supportato utilizzando Cloud Data Fusion. Il plug-in ha le seguenti funzionalità principali:

  • Utilizza SAP ECC, SAP S4/HANA o SAP BW come sistema di origine
  • Non utilizza SAP CDC (Change Data Capture) per monitorare ed estrarre i dati nuovi e delta nelle origini dati
  • Utilizza la modalità di estrazione batch
  • Supporta tabelle SAP e viste ABAP CDS come origini dati
  • Accede ai dati SAP tramite il livello applicazione

Puoi leggere i dati da:

  • Tabelle trasparenti
  • Tabelle in cluster
  • Tavoli da biliardo
  • Visualizzazioni ABAP CDS
  • Oggetti SAP BW ADSO

Versioni software supportate

Software Versioni
SAP S4/HANA SAP S4/HANA 1909 e versioni successive
SAP ECC SAP ERP6 NW 7.31 SP16 e versioni successive
SAP JCo SAP JCo versione 3.0.20 e successive
Cloud Data Fusion 6.3 e versioni successive

Per saperne di più su SAP su Google Cloud, consulta la panoramica di SAP su Google Cloud.

Prima di iniziare

Configura i seguenti sistemi e servizi utilizzati dal plug-in SAP Table:

  1. Configura il sistema SAP ERP. Questa procedura include i seguenti passaggi:
    • Installa i file di trasporto SAP.
    • Configura le autorizzazioni e i ruoli SAP richiesti.
    • Configura SAP Java Connector.
  2. Esegui il deployment del plug-in in Cloud Data Fusion.

    • Importante: scegli una versione del plug-in compatibile con la versione di Cloud Data Fusion.
    • Se esegui l'upgrade della versione dell'istanza o del plug-in Cloud Data Fusion, valuta l'impatto delle modifiche sull'ambito funzionale e sul rendimento della pipeline.
  3. Stabilisci la connettività RFC tra Cloud Data Fusion e SAP.

    • Assicurati che la comunicazione sia abilitata tra l'istanza Cloud Data Fusion e il server SAP.
    • Per le istanze private, configura il peering di rete VPC.
    • Sia il sistema SAP sia l'istanza Cloud Data Fusion devono trovarsi nello stesso progetto.

Configurare il plug-in

  1. Vai all'interfaccia web di Cloud Data Fusion e fai clic su Studio.
  2. Verifica che sia selezionata l'opzione Pipeline di dati - Batch (non In tempo reale).
  3. Nel menu Origine, fai clic su Tabella SAP. Il nodo SAP Table viene visualizzato nella pipeline.
  4. Per configurare l'origine, vai al nodo Tabella SAP e fai clic su Proprietà.
  5. Inserisci le seguenti proprietà. Per un elenco completo, consulta Proprietà.

    1. Inserisci un'etichetta per il nodo Tabella SAP, ad esempio SAP tables.
    2. Inserisci i dettagli della connessione. Puoi configurare una nuova connessione una tantum o una connessione esistente riutilizzabile.

      Nuova connessione

      Per aggiungere una connessione una tantum a SAP:

      1. Mantieni disattivata l'opzione Usa connessione.
      2. Nella sezione Connessione, inserisci le seguenti informazioni dell'account SAP in questi campi:

        1. Nel campo Nome di riferimento, inserisci un nome per la connessione che identifica questa origine per la derivazione.
        2. Nel campo Client SAP, inserisci il nome client di un'istanza o un ambiente specifico in SAP. Un amministratore SAP può fornire il nome del client.
        3. Nel campo Lingua SAP, inserisci una lingua di accesso SAP. Il valore predefinito è EN (inglese).
        4. Seleziona uno dei seguenti tipi di connessione.

          • Diretto (tramite il server delle applicazioni SAP). Se scegli questo tipo predefinito, inserisci le informazioni nei seguenti campi: Host del server delle applicazioni SAP, Numero di sistema SAP e SAP Router.
          • Bilanciamento del carico (tramite SAP Message Server). Se scegli questo tipo, inserisci le informazioni nei seguenti campi: Host SAP Message Server, Servizio SAP Message Server o numero di porta, ID sistema SAP (SID) e Nome gruppo di accesso SAP.
        5. Nel campo Nome tabella/vista SAP, inserisci il nome della tabella o della vista del tuo sistema SAP.

        6. Fornisci le credenziali SAP: chiedi all'amministratore SAP Nome utente di accesso SAP e Password.

        7. Nel campo Percorso Cloud Storage della libreria JCo, inserisci il percorso di SAP Java Connector (SAP JCo) in Cloud Storage che contiene i file della libreria SAP JCo che hai caricato.

        8. Per generare uno schema basato sui metadati di SAP che mappano i tipi di dati SAP ai tipi di dati Cloud Data Fusion corrispondenti, fai clic su Ottieni schema. Per saperne di più, consulta Mappature dei tipi di dati.

        9. (Facoltativo) Per ottimizzare il carico di importazione da SAP, inserisci le informazioni nei seguenti campi:

          1. L'utilizzo delle opzioni di filtro consente di estrarre i record in base a condizioni di selezione, ad esempio colonne con un insieme definito di valori. Definisci le condizioni nella sintassi OpenSQL in una clausola WHERE. Ad esempio, questa query restituisce tutte le righe della tabella Roster in cui la colonna SchoolID ha il valore SchoolID > 52:

            SELECT * FROM Roster WHERE SchoolID > 52;
            

            Per ulteriori informazioni, vedi Filtri supportati.

          2. Nel campo Numero di righe da recuperare, puoi limitare i dati estratti fornendo un numero intero positivo di righe.

          3. Nel campo Numero di suddivisioni, puoi creare partizioni per estrarre i record di dati in parallelo, il che migliora il rendimento. Il numero di suddivisioni può influire sui processi di lavoro SAP e deve essere selezionato con attenzione.

          4. Nel campo Dimensioni pacchetto, specifica il numero di record da estrarre in una singola chiamata di rete SAP. Le dimensioni del pacchetto influiscono sulle prestazioni e sulle risorse disponibili e devono essere selezionate con attenzione.

      Connessione riutilizzabile

      Per riutilizzare una connessione esistente:

      1. Attiva l'opzione Usa connessione.
      2. Fai clic su Browse connections (Sfoglia connessioni).
      3. Fai clic sul nome della connessione.

      Se non esiste una connessione, per crearne una riutilizzabile, segui questi passaggi:

      1. Fai clic su Aggiungi connessione > SapTable.
      2. Nella pagina Crea una connessione SapTable che si apre, inserisci un nome e una descrizione per la connessione.
      3. Nel campo Client SAP, inserisci il nome client di un'istanza o di un ambiente specifico in SAP. Un amministratore SAP può fornire il nome del cliente.
      4. Nel campo Lingua SAP, inserisci una lingua di accesso SAP. Il valore predefinito è EN (inglese).
      5. Seleziona uno dei seguenti tipi di connessione.

        • Diretto (tramite il server delle applicazioni SAP). Se scegli questo tipo predefinito, inserisci le informazioni nei seguenti campi: Host del server applicazioni SAP, Numero di sistema SAP e SAP Router.
        • Bilanciamento del carico (tramite SAP Message Server). Se scegli questo tipo, inserisci le informazioni nei seguenti campi: Host SAP Message Server, Servizio SAP Message Server o numero di porta, ID sistema SAP (SID) e Nome del gruppo di accesso SAP.
      6. Fornisci le credenziali SAP: chiedi all'amministratore SAP i valori Nome utente di accesso SAP e Password.

      7. Nel campo Percorso Cloud Storage della libreria JCo, inserisci il percorso di SAP Java Connector (SAP JCo) in Cloud Storage che contiene i file della libreria SAP JCo che hai caricato.

      8. (Facoltativo) Nel campo Proprietà di connessione SAP aggiuntive, inserisci le coppie chiave-valore che devono sostituire i valori predefiniti di SAP JCo.

      9. Fai clic su Crea.

Proprietà

Proprietà Con macro Proprietà obbligatoria Descrizione
Etichetta No Il nome del nodo nella pipeline di dati.
Utilizzare la connessione No No Utilizza una connessione riutilizzabile. Se viene utilizzata una connessione, non è necessario fornire le credenziali. Per saperne di più, consulta Gestire le connessioni.
Nome di riferimento No Se l'opzione Utilizza connessione non è attiva, questo campo viene visualizzato. Il nome della connessione da utilizzare per la derivazione.
Nome No Se l'opzione Utilizza connessione è attiva, viene visualizzato questo campo. Il nome della connessione riutilizzabile.
Client SAP L'istanza o l'ambiente in un sistema SAP.
Scatta snapshot Abilita gli snapshot dei dati in SAP.
Quando attivare gli snapshot:
  • Estrazione da qualsiasi dato di tabella transazionale attivo
  • Estrazione sulle tabelle in cui le query sui dati sono più lente e consumano più memoria per ogni chiamata di estrazione.

Quando disattivare gli snapshot: esegui più estrazioni di dati di grandi volumi in parallelo. Gli snapshot utilizzano tabelle buffer in SAP, il che potrebbe causare problemi di out of memory in SAP. Al completamento dell'estrazione dei dati, tuttavia, la tabella buffer viene cancellata.
Lingua SAP La lingua in cui vengono visualizzati ed elaborati l'interfaccia utente e i dati SAP.
Tipo di connessione No Il tipo di connessione SAP: Direct o Load balanced.
Host del server applicazioni SAP No Solo per il tipo di connessione Direct, questo nome host proviene dal server di applicazioni SAP, che funge da livello intermedio tra i client SAP (come l'interfaccia web SAP, i browser web o le app mobile) e il database sottostante.
Numero di sistema SAP No Solo per il tipo di connessione Direct, questo numero è l'identificatore univoco assegnato a ogni sistema SAP. Ad esempio, 00.
SAP Router No Solo per il tipo di connessione Direct, questa è la stringa del router per il server proxy, che fornisce un canale sicuro per la comunicazione tra i sistemi SAP e i client o partner esterni.
Host del server di messaggi SAP No Solo per il tipo di connessione Bilanciamento del carico, questo è il nome dell'host, che facilita il bilanciamento del carico su più server delle applicazioni in SAP.
Servizio o numero di porta del server di messaggi SAP No Solo per il tipo di connessione bilanciamento del carico, questa è la porta di rete in cui SAP Message Server è in attesa di connessioni in entrata da client SAP e server delle applicazioni all'interno di SAP.
ID sistema SAP (SID) No Solo per il tipo di connessione Bilanciamento del carico, questo ID viene assegnato a ogni sistema SAP.
Nome del gruppo di accesso SAP No Il nome del raggruppamento logico o della configurazione di più server di applicazioni SAP. Il valore predefinito è PUBLIC.
Nome tabella/visualizzazione SAP Un nome di tabella o vista valido e senza distinzione tra maiuscole e minuscole da cui è possibile estrarre tutte le colonne.
Nome utente di accesso SAP Nome utente per SAP
Consigliato: se il nome utente cambia periodicamente, utilizza una macro.
Password di accesso SAP Password SAP.
Consigliato: utilizza le macro sicure.
ID progetto GCP ID progettoGoogle Cloud .
Percorso GCS della libreria SAP JCo Il percorso di Cloud Storage in cui hai caricato i file della libreria SAP JCo.
Ottieni schema N/D N/D Il plug-in genera uno schema basato sui metadati di SAP, che mappa i tipi di dati SAP ai tipi di dati Cloud Data Fusion corrispondenti. Consulta Mappatura dei tipi di dati.
Proprietà di connessione SAP aggiuntive No Imposta proprietà SAP JCo aggiuntive per sostituire i valori predefiniti di SAP JCo. Ad esempio, l'impostazione di jco.destination.pool_capacity = 10 sovrascrive la capacità predefinita del pool di connessioni.
Filtri No Condizioni specificate nella sintassi Open SQL che filtrano utilizzando una clausola SQL WHERE. Estrai i record in base a condizioni, ad esempio quelli nelle colonne con un insieme di valori definito o un intervallo di valori.
Per ulteriori informazioni, vedi Filtri supportati.
Numero di righe da recuperare No Limita il numero di record estratti.
  • Inserisci un numero intero positivo.
  • Se il valore è 0 o viene lasciato vuoto, Cloud Data Fusion estrae tutti i record dalla tabella.
  • Se inserisci un valore positivo maggiore del numero di record selezionati (in base agli altri valori del filtro), Cloud Data Fusion estrae solo i record selezionati.
Numero di suddivisioni da generare No Crea partizioni per estrarre i record in parallelo.
Il motore di runtime crea il numero specificato di partizioni (e connessioni SAP) durante l'estrazione dei record.
Fai attenzione quando aumenti questo valore, in quanto aumenta le connessioni simultanee con SAP.
Consigliato: pianifica di avere connessioni SAP per ogni pipeline e il numero totale di pipeline in esecuzione contemporaneamente.
Se il valore è 0 o viene lasciato vuoto, Cloud Data Fusion sceglie un valore appropriato in base al numero di executor disponibili, ai record da estrarre e alle dimensioni del pacchetto.
Dimensioni pacchetto No Il numero di record da estrarre in una singola chiamata di rete SAP. È il numero di record che SAP memorizza nel buffer in memoria durante ogni chiamata di estrazione di rete.
Fai attenzione quando imposti questa proprietà. Più pipeline di dati che estraggono dati possono raggiungere il picco di memoria utilizzata, causando errori dovuti a Out of memory.
  • Inserisci un numero intero positivo.
  • Se è 0 o viene lasciato vuoto, il plug-in utilizza un valore standard di 70.000 o un valore calcolato in modo appropriato.
  • Se la pipeline di dati non va a buon fine a causa di errori Out of memory, riduci le dimensioni del pacchetto o aumenta la memoria disponibile per i processi di lavoro SAP.

Filtri supportati

Sono supportate le seguenti condizioni di filtro.

Filtro contenente un operatore di confronto

Utilizza gli operatori di confronto per eseguire filtri più complessi in base ai confronti tra valori.

Sintassi
    SELECT * FROM table_name WHERE column_name > value; \
    SELECT * FROM table_name WHERE column_name BETWEEN value1 AND value2;
    
Esempio
AUDAT GT '20230914'

Filtro contenente un operatore LIKE

Utilizza gli operatori LIKE per la corrispondenza dei pattern. Per trovare la corrispondenza con qualsiasi carattere, utilizza il simbolo % come carattere jolly.

Sintassi
    SELECT * FROM table_name WHERE column_name LIKE 'pattern%';
    
Esempio
ERNAM LIKE 'KIRAN%'

Filtro contenente un operatore IN

Utilizza gli operatori IN per specificare un elenco di valori da confrontare.

Sintassi
    SELECT * FROM table_name WHERE column_name \
      IN ('value1', 'value2', 'value3');
    
Esempio
ERNAM IN ( 'LEE' , 'KIRAN' )

Filtro contenente un operatore logico

Utilizza gli operatori logici per specificare un elenco di valori da confrontare.

Sintassi
    SELECT * FROM table_name WHERE condition1 AND condition2; \
      SELECT * FROM table_name WHERE condition1 OR condition2; \
      SELECT * FROM table_name WHERE NOT condition;
    
Esempi
  • ( AUDAT EQ '20220615' ) AND ( ERNAM LIKE 'LEE%' )
  • ( AUDAT EQ '20220615' ) OR ( AUDAT EQ '20220617' )

Filtro contenente un intervallo di date

Utilizza gli intervalli di date per recuperare le righe in cui una colonna datetime rientra in un intervallo di date specifico.

Sintassi
    SELECT * FROM table_name \
      WHERE datetime_column >= 'start_date' AND datetime_column <= 'end_date';
    
Esempio
AUDAT GE '20230910' AND AUDAT LE '20230914'

Filtro contenente un confronto di date

Utilizza i confronti tra date per recuperare le righe in cui viene utilizzata la data e l'ora.

Sintassi
    SELECT * FROM table_name WHERE datetime_column > 'target_date';
    
Esempio
AUDAT GE '20230910' AND AUDAT LE '20230914'

Filtro che combina data e ora

Se la colonna data e ora include sia la data che l'ora, puoi filtrare di conseguenza.

Sintassi
    SELECT * FROM table_name \
      WHERE datetime_column >= 'target_datetime' \
      AND datetime_column <= 'target_datetime';
    
Esempio
TIMESTAMP GE '20210602144800' AND TIMESTAMP LE '20210624080836'

(Formato timestamp : AAAAMMGGHHMMSS)

Filtro che combina più condizioni con operatori logici

Puoi recuperare le righe che soddisfano più condizioni utilizzando operatori logici, come AND e OR.

Sintassi
    SELECT * FROM table_name \
      WHERE (column1 = 'value1' AND column2 > value2) \
      OR (column3 = 'value3' AND column4 < value4);
    
Esempio
    ( ERNAM EQ 'LEE' AND AUDAT GT '20220722' ) \
      OR ( BSTNK EQ 'PO54321065' AND BSTDK LT '20220714' )
    

Filtro che combina condizioni nidificate

Puoi combinare le condizioni in modo nidificato per creare filtri complessi.

Sintassi
    SELECT * FROM table_name \
      WHERE (column1 = 'value1' OR (column2 = 'value2' AND column3 > value3)) \
      AND column4 = 'value4';
    
Esempio
    ( ERDAT EQ '20220722' OR ( ERNAM EQ 'LEE' AND VDATU GT '20210623' ) ) \
      AND FMBDAT EQ '20220722'
    

Filtro che utilizza le sottoquery

Puoi utilizzare le sottoquery per filtrare in base ai risultati di un'altra query.

Sintassi
    SELECT * FROM table_name \
      WHERE column1 IN (SELECT related_column FROM other_table WHERE condition);
    
Esempio
VBELN IN ( SELECT VBELN FROM VBAK WHERE ERNAM = 'LEE' )

Filtro che combina condizioni di data e valore

Puoi combinare condizioni basate sulla data e sul valore in un filtro complesso.

Sintassi
    SELECT * FROM table_name \
      WHERE (column1 = 'value1' OR column2 = 'value2') \
      AND datetime_column > 'target_datetime';
    
Esempio
    ( ERDAT EQ '20220722' OR ERNAM EQ 'LEE' ) AND VDATU GT '20210623'
    

Filtro contenente le date di formattazione

In SAP, i campi data e ora vengono sempre salvati senza - o : a livello di database.

Sintassi
    SELECT * FROM table_name \
      WHERE datetime_column >= 'YYYY-MM-DD HH:MM:SS' \
      AND datetime_column <= 'YYYY-M
    

Non supportato: filtro contenente funzioni e operatori di confronto

In SAP, le funzioni nella clausola WHERE della query non sono supportate.

Non supportato: filtro contenente intervalli

In SAP, la funzione NOW() non è supportata.

Sintassi
    SELECT * FROM table_name \
      WHERE datetime_column >= NOW() - INTERVAL X DAY;
    

Non supportato: filtro che estrae il componente data

In SAP, il filtro di offset non è supportato.

Esempio
    WHERE YEAR+0(4) = 2023
    

Mappature dei tipi di dati

La tabella seguente elenca i tipi di dati SAP con i tipi di Cloud Data Fusion corrispondenti.

Tipo di dati SAP Tipo ABAP SAP description Tipo di dati Cloud Data Fusion
INT1 (numerico) b Numero intero a 1 byte int
INT2 (numerico) s Numero intero a 2 byte int
INT4 (numerico) i Numero intero a 4 byte int
INT8 (numerico) 8 Intero a 8 byte Lungo
DEC (numerico) p Numero compresso in formato BCD (DEC) decimal
DF16_DEC, DF16_RAW (numerico) un Virgola mobile decimale a 8 byte IEEE 754r double
DF34_DEC, DF34_RAW (numerico) e Virgola mobile decimale a 16 byte IEEE 754r double
FLTP (numerico) f Numero binario in virgola mobile double
CHAR, LCHR (personaggio) c Stringa di caratteri string
SSTRING, GEOM_EWKB (personaggio) string Stringa di caratteri string
STRING (Carattere) string CLOB di stringa di caratteri byte
NUMC, ACCP (personaggio) n Testo numerico string
RAW, LRAW (byte) x Dati binari byte
RAWSTRING (byte) xstring BLOB di stringa di byte byte
DATS (data/ora) d Data data
TIMS (data/ora) t Ora tempo
TIMS (data/ora) utcl (Utclong), TimeStamp timestamp

Casi d'uso

Sono supportati due contesti di estrazione:

  • Tabelle e visualizzazioni del database SAP
  • SAP ABAP CDS

In ciascuno dei contesti, il plug-in Tabella SAP supporta tabelle e viste di database standard e personalizzate.

Limitazioni

Il plug-in SAP Table presenta le seguenti limitazioni:

  • Non supporta l'unione di tabelle.
  • Non supporta le viste CDS con parametri.
  • Non supporta i campi senza chiave.
  • Se la funzionalità Snapshot è abilitata, l'utilizzo di una dimensione del pacchetto superiore a 30.000 potrebbe causare errori della pipeline. Le dimensioni del pacchetto possono variare a seconda del numero di colonne nella tabella SAP. Puoi calcolare una dimensione ottimale del pacchetto per una tabella utilizzando questa formula: dimensione riga (in numero di caratteri) * 5.
  • Connection Manager ti consente di sfogliare un massimo di 1000 nomi di tabelle SAP.
  • Quando si verifica un errore della pipeline, ad esempio un errore nel sink, il plug-in SAP Table tenta di liberare spazio per tutti i processi lato SAP attivi correlati all'estrazione chiamando la RFM personalizzata destinata alla pulizia: /GOOG/RFC_READ_TABLE_CLEANUP.

Passaggi successivi