ANSI fájlból szlovák karakterek kinyerése

TIV · 2010. Szep. 8. (Sze), 10.34

Sziasztok!

Kezdek meghülyülni, kérlek segítsetek. Van egy txt fájlom, amit ha megnyitok notepad++-al, akkor szlovák karaktereket (Ľ, Ť, Č) és szövegeket látok benne, tökéletesen! A notepad++ szerint a fájl kódolása ANSI, ez biztos így is van. Ezt a fájlt én beolvasom PHP-val (a betöltő fájl is UTF-8 kódolást használ) és próbálom belenyomni egy UTF-8-as táblába (utf8_general_ci, de slovak_ci-vel is próbáltam). Itt vannak a bajok. Egyszerűen eltorzulnak az ékezetek. Az Ľ helyett ékezetes z lesz, a Ť helyén nem látszik semmi phpmyadminnal (de az oldalon kérdőjel jelenik meg helyette), a Č viszont megmarad helyesen. Egyszerűen nem tudom mit csináljak. Tudni kell, hogy ha a fájl kódolását átállítom UTF-8-ra notepad++-al, akkor hibátlanul berakja őket. Ha hagyom ANSI-n, akkor torzulnak az ékezetek. Ha SET NAMES utf8-at nyomok a beszúrások előtt, akkor kb. odáig írja be a szövegeket a táblába, amíg nem jön egy kacifántosabb ékezetes betű, de van ahol simán eltünteti az ékezeteket és úgy teszi be.

Mondom jól van, akkor mb_convert_encoding($szoveg, 'UTF-8', 'auto');
Unable to detect character encoding in.... remek. Ha a fájl kódolása UTF-8, minden rendben van. Meg lehet ezt oldani php-ből én úgy érzem, de hogyan? Vagy mindig át kell állítani a fájl kódolását? Hol hibázok?

Köszönöm nagyon!

■

csirip

hmm

TIV · 2010. Szep. 8. (Sze), 11.59

Sziasztok!

Azt vettem észre, hogy a file -bi a.txt parancs szerint (linux alatt) a fájl kódolása UNKNOWN. Ha Windows alatt notepad++-al megnyitom és átnyomom ANSI-ról UTF-8ra, akkor minden rendben van. Lehet, hogy van benne valami olyan karakter, ami nem fér bele az ANSI-ba? Kicsit hiányos a tudásom ezen a téren. Tud valaki segíteni?

Köszönöm!

A hozzászóláshoz regisztráció és belépés szükséges
új téma

Megoldódott

TIV · 2010. Szep. 8. (Sze), 13.43

A fájl, amire minden PHP-s eszköz és linuxos parancs azt mondta, hogy unknown charset, kiderült, hogy Windows-1250-es kódtáblát használ valójában, ebben vannak a szlovák karakterek tehát. Így már megoldódott a gond.

Amúgy az egyszerűség miatt azt csináltam, hogy a iconv-vel konvertálom át a fájlt, még mielőtt a PHP hozzányúlna:

iconv -f Windows-1250 -t UTF-8 ebbol.txt > ebbe.txt

Remélem segítettem valakinek ezzel.

A hozzászóláshoz regisztráció és belépés szükséges
új téma

Egyébként iconv függvény van

deejayy · 2010. Szep. 9. (Cs), 07.04

Egyébként iconv függvény van php-ben, ha az segít.

A hozzászóláshoz regisztráció és belépés szükséges
új téma

Friss blogmarkok

Web Akadálymentesítési Útmutató (WCAG) 2.1 – nyilvános munkaterv – Megjelent a WCAG (Web Akadálymentesítési Útmutató) 2.1 nyilvános munkaterv (0)
MongoDB Apocalypse Is Here as Ransom Attacks Hit 10,000 Servers – Több tízezer védtelen MongoDB szerverre csaptak le hackerek (2)
12 Signs You’re Working in a Feature Factory – A cél nélküli funkciógyártás néhány tünete (0)
Translatable, custom dates in Twig templates of Drupal 8 – Saját dátumok megjelenítése, fordíthatóan a Drupal 8 smink rétegével dolgozva (0)
NativeScript – Cross-Platform Native Development with Javascript – Fejlesszünk natív mobilalkalmazást JavaScripttel (0)
GitHub Security Update: Reused password attack – Érdemes bekapcsolni a kétfaktoros azonosítást, ha a GitHub jelszavunkat más oldalakon is újra felhasználtuk (17)
UX Design könyv – Hogyan tervezz felhasználóbarát és szerethető alkalmazásokat? (0)
Introducing unlimited private repositories – Megváltozik a GitHub díjszabása: minden előfizetéshez korlátlan számú privát repository jár (0)
Drupal 8 Twig: add custom CSS classes to menus (based on menu name) – Saját elképzeléseink szerinti CSS osztályok (automatizált) hozzáadása a Drupal 8 menüihez (0)

tovább»

július 2026
H	K	Sze	Cs	P	Szo	V
29	30	1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31	1	2

július 2026

Sze

Szo

Weblabor

Keresés