/ / Ako ignorovať skrytý stĺpec v programe MS Excel v úlohách pentaho? - pentaho, pentaho-spoon, pentaho-data-integration, pentaho-report-designer, pentaho-design-studio

Ako ignorovať skrytý stĺpec v programe MS Excel v úlohách pentaho? - pentaho, pentaho-spoon, pentaho-data-integration, pentaho-report-designer, pentaho-design-štúdio

V zdrojových zdrojoch, ktoré majú štandardne iba 16 stĺpcov.

  1. v mojom prvom súbore s 4 skrytými stĺpcami medzi názvami stránok a CAMPAIGNNAME.
  2. v mojom druhom súbore majú 2 skryté stĺpce medzi názvami stránok a CAMPAIGNNAME
  3. rovnako ako moje všetky stĺpce súborov skrývajú rôzne odlišné Formát. Pozrite si obrázky, ktoré som pripojil.File 1 tu zadajte popis obrázkuSúbor 2 tu zadajte popis obrázku
  4. Takže ako vytvoriť jednu pentaho úlohu pre všetky načítanie súborov. mohol prosím, pomôžte? Vďaka.

odpovede:

0 pre odpoveď č. 1

Malý počet súborov: Keď sa zdá, že máte iba dva súbory, najjednoduchšie je pravdepodobne prehltnúť dva súbory programu Excel so svojim príslušným formátom, potom použiť Select values zachovať iba príslušné stĺpce a zlúčiť ich pre zvyšok transformácie.

Je možné, že PDI zlúči dva (alebo viac) toky vstupov, ale vyžaduje, aby vstup mal presne rovnaké metaúdaje (rovnaké stĺpce, rovnaké názvy, rovnaký typ, ...), čo sa robí s Select value.

tu zadajte popis obrázku

Veľký počet súborov:

Ak máte veľký počet súborov, musíte to urobiťčítaj ich bez názvu stĺpca (t. j. bez hlavičky), ktorý volá stĺpce A, B, C, D, ... Potom odfiltrujte spojky, o ktoré nemáte záujem, a zmeňte metadáta.

Napokon môžete použiť a Metadata Injection Step.