ugrás a tartalomhoz

utf8 kódolású szöveg karakterekre - jelekre - bontása

griphons · 2008. Dec. 2. (K), 11.05
Üdv!

Egy többnyelvű weboldalt készítek munkahelyemen (magyar, angol, német, francia, lengyel, orosz, japán, spanyol), aminél a menüpontokat úgy készítettem el, hogy az első karakternek más a formázása, így a menüpontok szövegeit szét kell darabolnom első karakterre és a többi részre.
A gondom, hogy az UTF8 kódolású szövegnél az idegen jelek (ékezetes karakterek, cyril betűk, japán karakterek) nem egy byte-on helyezkednek el, így a szó szétbontása problémákba ütközik. Annál is inkább, mivel a latin2 karakterei 2 míg a bonyolultabb nem szabványos jelek 3 byte-on tárolódnak. Ezt a dilemmát sajnos az utf8_decode() függvény sem oldja fel.
Hogyan tudnám univerzálissá tenni a szövegbontást, hogy minden jelre tökéletesen működjön?
 
1

mb_string függvénykönyvtárral

bonga · 2008. Dec. 2. (K), 11.48
Esetleg próbáld meg a következő függvénnyel:
http://hu.php.net/manual/en/function.mb-strcut.php
2

Köszi

griphons · 2008. Dec. 2. (K), 12.29
Köszi, a multibyte függvényeket totál elfelejtettem :)
Problem solved (bár én a mb_substr-t használtam) kösz még1szer