V zdrojových zdrojoch, ktoré majú štandardne iba 16 stĺpcov.
- v mojom prvom súbore s 4 skrytými stĺpcami medzi názvami stránok a CAMPAIGNNAME.
- v mojom druhom súbore majú 2 skryté stĺpce medzi názvami stránok a CAMPAIGNNAME
- rovnako ako moje všetky stĺpce súborov skrývajú rôzne odlišné Formát. Pozrite si obrázky, ktoré som pripojil.File 1 Súbor 2
- Takže ako vytvoriť jednu pentaho úlohu pre všetky načítanie súborov. mohol prosím, pomôžte? Vďaka.
odpovede:
0 pre odpoveď č. 1Malý počet súborov:
Keď sa zdá, že máte iba dva súbory, najjednoduchšie je pravdepodobne prehltnúť dva súbory programu Excel so svojim príslušným formátom, potom použiť Select values
zachovať iba príslušné stĺpce a zlúčiť ich pre zvyšok transformácie.
Je možné, že PDI zlúči dva (alebo viac) toky vstupov, ale vyžaduje, aby vstup mal presne rovnaké metaúdaje (rovnaké stĺpce, rovnaké názvy, rovnaký typ, ...), čo sa robí s Select value
.
Veľký počet súborov:
Ak máte veľký počet súborov, musíte to urobiťčítaj ich bez názvu stĺpca (t. j. bez hlavičky), ktorý volá stĺpce A, B, C, D, ... Potom odfiltrujte spojky, o ktoré nemáte záujem, a zmeňte metadáta.
Napokon môžete použiť a Metadata Injection Step
.