kódolás felismerése
Sziasztok!
Ti hogyan állapítantok meg egy sztrigről, hogy milyen karakterkódolásban van?
Az mb_detect_encoding() nem jó, mert az egy megadott listából választja ki, amiket még prioritási sorba is kell rendezni, ráadásul úgy vettem észre, ha egy UTF szövegben csak annyi szerepel, hogy "asd", akkor rámondja hogy ASCII, mert ezek a betűk elférnek az ASCII táblában.
Köszönöm!
■ Ti hogyan állapítantok meg egy sztrigről, hogy milyen karakterkódolásban van?
Az mb_detect_encoding() nem jó, mert az egy megadott listából választja ki, amiket még prioritási sorba is kell rendezni, ráadásul úgy vettem észre, ha egy UTF szövegben csak annyi szerepel, hogy "asd", akkor rámondja hogy ASCII, mert ezek a betűk elférnek az ASCII táblában.
Köszönöm!
Csodák nincsenek
Hát ennyiből még egy ember sem tudja megállapítani, hogy mi lehet, max annyi, hogy valami latinbetűs és biztosan ASCII :)
ez voltaképpen igaz
Pontosíts
szerte a nagyvilágból
enca
Fejlécből?
Én a helyedben először ilyen phpclasses.org típusú helyeken keresnék vagy keress olyan open source programokat (például webmail) amik megcsinálják, ami kell neked.
Döntse el a user!
A legkönnyebb megoldás, ha megkérdezed a felhasználótól, hogy milyen kódolással szeretné, ha kezelnéd a dokumentumát, az alapértelmezett mondjuk UTF-8. Esetleg közlöd vele, hogy ha szeretné, hogy a fura betűi is jól jelenjenek meg, és nem tudja biztosan, hogy milyen kódolással készült a szöveg, akkor mentse el UTF-8 formátumban, és akkor azt meg tudja jelölni feltöltésnél, az ékezetei a helyükön lesznek.
Egy hangyabokányi
Annyit lehetett tenni, hogy a bizonytalan szitukat elkülönítettem (van most egy kis legördülőmenüs választási lehetőség), és felhívom a figyelmet, ha kriksz-krakszokat lát egy editorral mentse utf8 formátumban. Kaptak rá linket is. Nem hinném, hogy megteszik, de hátha lesz egy 0,01% aki mégis...
Találtam egy jól használható konvertáló osztályt is. Hátha valakinek jól jön.
Közben viszont elgondokoztam, hogy honnan tudja egy asztali alkalmazás eldönteni akkor teljes biztonsággal a kódolást? Mert az editorok nem szoktak zavarba jönni, szépen kiirják, hogy miben nézem. Még egy notepad++ is.
Én láttam már tévedni őket
Már ha sima TXT-ről beszélünk.