xls-ből xml fájl magyar ékezetekkel
Sziasztok !
Excel reader-rel beolvasok egy xls fájlt, amiben magyar ékezetes karakterek is vannak.
A beolvasott adatokat kiírom egy xml fájlba szabályos szerkezettel, viszont az ékezetekkel gondjaim vannak.
Valami ötlet ?
Előre is köszönöm a segítségeteket.
■ Excel reader-rel beolvasok egy xls fájlt, amiben magyar ékezetes karakterek is vannak.
A beolvasott adatokat kiírom egy xml fájlba szabályos szerkezettel, viszont az ékezetekkel gondjaim vannak.
Valami ötlet ?
Előre is köszönöm a segítségeteket.
ötlet…
egyik érdemes lehetőség:
használj az XML-ben is Kelet-európai kódolást (ISO8859-2)
másik eshetőség:
konvertáld át UTF-8 kódolásúra az adatokat az iconv vagy mbstring kiterjesztések segítségével:
ajánlott még a XML node-okon belül CDATA-ba tenni az adatokat ésakkor nem kell őket htmlspecialchars()-ni:
kódolás
XLS
fájl milyen kódolással kerül kiolvasásra, majd azt kell átalakítaniUTF-8
-ra. Ez valószínűleg eredetilegUTF-16LE
ezért ennek megfelelően kell végezni az átkódolást.hogyan
próbálkozás
UTF-16
,UTF-32
,UCS2
ésUCS4
kódolások esetén a dokumentáció szerint.előfordulhat
Nem hinném
nagyjából
És a többi oszlopban jó az ő
nem
ühüm
Nálam is a már fentebb leírt megoldás működött, ISO-8859-2-ben olvastam be és iconv-val utf-8-ra kódoltatott. Ez nálam eddig még mindennel megbirkózott.
Látva eddigieket
Karakterkódolás: ha tudod, hogy milyen szoftverrel készül a dokumentum, akkor onnét érdemesebb elindulni, feltéve, ha egy vagy egymással azonos (beállítású) progiktól jön a cucc. Excel2002 esetén az Eszközök/Beállítások menü, Általános fül, webes beállítások gomb, Kódolás fül. Szerintem az egész fájl kódolása u.ez lesz, magyar progi (vagy windows) esetén alapértelmezetten windows-1250. Ezt nem tudom, fel tudja-e dolgozni az
iconv()
, de ha meg tudod oldani, akkor lehet, hogy érdemes(ebb) a fájlokat eleve utf-8-ban menteni. Persze az a tuti, ha a fájlból megtudod (programmal), de az nehezen fog menni (ha egyáltalán).