UTF-8 file beolvasás
Sziasztok
Van pár csv file-om UTF-8 kódolással, amit be kell vinnem egy adatbázisba úgy, hogy minden rekordot meg kell néznem, hogy létezik-e már, és csak akkor kell beszúrni, ha nem.
Név, email alapján keresek, az adatbázisban tárolva van egy egyszerűsített név mező, ami a következő: csupa kisbetű, ékezetek helyén a rövid pár, szóközök nélkül, pl. Hegedűs Géza = hegedusgeza.
Nyilván az utóbbit szeretném összehasonlítani ha már van ilyen, ezért a beolvasott nevet is szeretném átalakítani, de elakadtam, mivel az ékezeteket eddig nem tudtam lecserélni.
Próbálkoztam az "utf8_decode" fv-el, de mivel az ISO-8859-1-re konvertál, nincs ő és ű betű, a többit utána át tudta konvertálni (á=>a, é=>e stb..), talán ISO-8859-2-re kéne, vagy máshogy?
Minden ötletnek örülnék
kösz
üdv
BL
■ Van pár csv file-om UTF-8 kódolással, amit be kell vinnem egy adatbázisba úgy, hogy minden rekordot meg kell néznem, hogy létezik-e már, és csak akkor kell beszúrni, ha nem.
Név, email alapján keresek, az adatbázisban tárolva van egy egyszerűsített név mező, ami a következő: csupa kisbetű, ékezetek helyén a rövid pár, szóközök nélkül, pl. Hegedűs Géza = hegedusgeza.
Nyilván az utóbbit szeretném összehasonlítani ha már van ilyen, ezért a beolvasott nevet is szeretném átalakítani, de elakadtam, mivel az ékezeteket eddig nem tudtam lecserélni.
Próbálkoztam az "utf8_decode" fv-el, de mivel az ISO-8859-1-re konvertál, nincs ő és ű betű, a többit utána át tudta konvertálni (á=>a, é=>e stb..), talán ISO-8859-2-re kéne, vagy máshogy?
Minden ötletnek örülnék
kösz
üdv
BL
mb_strtolower, strtr
Multi byte stringkezelő függvényekre van szükséged
azon belül is a kódoló függvényre
http://hu.php.net/manual/hu/function.mb-convert-encoding.php
$str = mb_convert_encoding($str, "ISO-8859-2", "UTF-8");
Sajnos az mb string nem egy default kiterjesztés, ezért lehet telepítenedd kell vagy meg kell kérned a szolgáltatót, hogy állítsa be neked. (vagy szolgáltatót kell váltanod)
pp
multibyte string functions..
Ha UTF8ban mented el a fájlt, akkor az ékezetek összehasonlíthatóak lesznek - találatot adnak csere esetén -, míg más kódolásban előtte át kell konvertálni 'a PHP-scriptet-amiben-mentetted' kódlapról UTF8-ra (ez a normális, mert ugye az UTF8 a teljes paletta). DE megoldható így is, használd az iconv()-ot
köszönöm
kösz, akkor jol sejtettem h ezekre szükség lehet (google-öztem a témában előtte), aki írta hogy minek az egyszerüsített név, nos nem tudom:) A megbízó kérte, eddig nem volt sok haszna, az adatbázissémát úgy kaptam, nekem csak ki kellett dolgozni a táblákat, kapcsolatokat, és nem kérdeztem hogy mire kell, lehet egyszer szükség lesz rá.
kösz még1szer
üdv
BL