Pentaho/Spoon-al lehet szerintetek ilyet?
Hello,
Persze biztos lehet, na de hogyan. :-) Van egy CSV adatbázisom amiben termékek vannak, és a kategória így lett megadva:A cél az lenne, hogy ilyen formába tudjam átalakítani:Elsőnek azzal próbálkoztam, hogy csináltam két "Filter rows" szűrést egy "Transformation"-ben, egyiket a kategóriára, másikat pedig a termékre, így született egy kategória listám és egy termék adatbázisom, de gondba voltam azzal hogyan lehetne ezt összeilleszteni, ahogy az utóbbi ábrán.
Kerestem ez után, de nem nagyon sikerült értelmes találatot találni (lehet rosszul közelítem meg a dolgot). Szerintetek?
■ Persze biztos lehet, na de hogyan. :-) Van egy CSV adatbázisom amiben termékek vannak, és a kategória így lett megadva:
|-----------------|--------|--------------|-----|
| Árú megnevezése | Egység | Gyűjtőcsomag | ... |
|-----------------|--------|--------------|-----|
| Kategória név 1 | NULL | NULL | NUL | <--- kategória 1
| Termék név 1 | 10 db | 1234 | ... |
| Termék név 2 | 10 db | 1234 | ... |
| Termék név 3 | 10 db | 1234 | ... |
| Termék név 4 | 10 db | 1234 | ... |
| Kategória név 2 | NULL | NULL | NUL | <--- kategória 2
| Termék név 1 | 10 db | 1234 | ... |
| ............... | ...... | ............ | ... |
|-----------------|------------------|--------|--------------|-----|
| Árú megnevezése | Kategória | Egység | Gyűjtőcsomag | ... |
|-----------------|------------------|------- |--------------|-----|
| Termék név 1 | Kategória név 1 | 10 db | 1234 | ... |
| Termék név 2 | Kategória név 1 | 10 db | 1234 | ... |
| Termék név 3 | Kategória név 1 | 10 db | 1234 | ... |
| Termék név 4 | Kategória név 1 | 10 db | 1234 | ... |
| Termék név 1 | Kategória név 2 | 10 db | 1234 | ... |
| ............... | ................ | .......|............. | ... |
Kerestem ez után, de nem nagyon sikerült értelmes találatot találni (lehet rosszul közelítem meg a dolgot). Szerintetek?
program
Vagy inkább kettőt, a kategória külön táblába való.
Sikerült megoldani házon belül
Lehet használni benne Script-eket, amivel megtudtam egyszerűen oldani a problémát:
Igen
Azt hiszem beleszaladtam :)
Na most megcsináltam, hogy a "Microsoft Excel input"-al betöltöm a könyvtárban lévő összes XLS-t, aztán beállítom a Sheet-et (ez nem változik, mindenhol ugyanaz), majd lekérem a "Fields"-eket. Itt nagytakarítást kellett végezni, letisztítottam a _1, _2, .. végződésű elemeket és csak azok maradtak bent, amelyek előfordulhatnak.
Nos a dolog működik is részben, mert az XLS-t ugyan betölti, de azzal teljesen összelehet zavarni ha mondjuk egy másik XLS-ben sorrendileg más helyen van az oszlop.
Azt meglehet-e valahogy csinálni (scriptelés nélkül), hogy párosítsa az oszlopokat fejléc név alapján?
Nem tudom
Namost, erre ket mod van. Az egyik, hogy csak siman osszefesulod, ez esetben leteszel egy dummy node-ot es abba behuzod az osszes bemenetet. A masik, hogy az append streams parancsot hasznalod. Ahhoz hogy ez mukodjon viszont kell az, hogy az osszes streamedben ugyanazok a mezok legyenek ugyanolyan sorrendben es azonos adattipussal.
Ha ez nem adott, akkor van egy select values parancs, illetve az add constants parancs, amivel ki tudod egesziteni a mezoket.
Remelem, segitett. Ha nem, talalj be Skypeon, screen sharinggel megnezem a transzformaciodat.