ugrás a tartalomhoz

Php és a text fájl encoding

inf · 2007. Jún. 23. (Szo), 17.54
Üdv.

Az a problémám, hogy ő és ű betűt szeretnék az oldalamra. Ez így elsőre könnyűnek is tűnt, beállítottam a headert stb. Viszont a php nem hajlandó unicode encodinggal rendelkező text fájlt phpként futtatni. Forrásnak visszakapom a php kódomat. Csak az ANSI encodinggal mentett fájl fut le rendesen, ebben viszont nincsen vesszős ő betű, csak hullámos. Természetesen nem csak notepaddel próbálkoztam de a hullámos ő a legtöbb, amit ki tudtam hozni. (Angol windowsom van, ha ez lehet probléma)

Azt szeretném kérdezni, hogy tudja e valaki a problémára a megoldást?
 
1

Helyes kódolás

Rici · 2007. Jún. 23. (Szo), 19.01
Ha ANSI-ban mented a fájlt, és rendes ő betűt szeretnél, akkor iso-8859-2 -es karakterkódolásnak megfelelő headert küldj.

Ami ennél sokkal jobb módszer, ha (pl. notepad-ben) UTF-8 kódolással mented a fájlt, és UTF-8 karakterkódolást jelentő headert küldesz.

Unicode (két bájtos) karakterkódolású forrásfájlt a PHP nem támogat.
2

Nem jó

inf · 2007. Jún. 24. (V), 15.45
Pont az a problémám, hogy ha ANSIban mentem, akkor az ő helyett o lesz belőle notepaddel. Automatikusan átírja, nem viccel a progi xD alap, hogy latin2es headert használok, de ha egyszer nem bírok sehogy sem ő betűt bevinni a forrásba, akkor édesmindegy, hogy hogyan akarom kiíratni, mert nincs benne. Valszeg az angol windowsomhoz kéne feltenni valamit, hogy működjön a dolog, de ez csak tipp, nem vagyok benne biztos.
3

Kódolás

Rici · 2007. Jún. 24. (V), 19.07
Angol beállításokkal ő betűből ANSI kódoláskor tényleg o lesz, de ekkor a Notepad pl. fel is dob egy ablakot, hogy rendesen nem tudja menteni a fájlt. Ha hullámos õ betűt írsz bele, és mented ANSI kódolással, majd iso-8859-2 -ként szolgálod ki php-ből, akkor kapsz ő betűt a böngészőben. De ugyebár ez elég gány megoldás.

Ezért is írtam, hogy sokkal jobb, ha utf-8 kódolást használsz mentéskor, és a http headerben is. Nem vicc, próbáld ki :)

Egyébként nem az oprendszer nyelvétől függ, hogy az ANSI kódolást mit jelent, hanem a vezérlőpultban megadott területi beállításoktól. Tehát angol windowson is csinálhatod azt, hogy az ő betűt a notepad ANSI kódolással ne o-vá konvertálva mentse, mindössze magyar beállításokat kell választani. És ez nem a billentyűzet beállítása, hanem a Regional Options, vagy Területi beállítások.
5

Működik

inf · 2007. Jún. 25. (H), 08.23
Köszi, működik, most már tudok ANSIval is ő betűt kiíratni :-) az utf-8at még nem próbáltam, mert html-kitben azt hiszem nem lehet kódolást állítani mentéshez, alapból csak ANSIban ment, de tesztelem nemsokára azt is.
szerk:
most sikeresen ír ki ő betűs dolgokat, viszont most meg olyan problémám van, hogy a http authban megadott dolgokban nincs ő, hanem Q van helyette. Kezdem "nagyon" megszeretni a headereket meg a charseteket meg az encodingot.
4

Editor

vbence · 2007. Jún. 24. (V), 20.38
Mi lenne ha egy normális text editort hazsnálnál, ami támogatja a kódolásokat, és nem szivatnád magad ilyen notepad szintű dolgokkal?
6

rendben

inf · 2007. Jún. 25. (H), 08.27
Rendben, mondj egyet. Nekem HTML-KITet ajánlották, tényleg tetszik, mert jó, van 1-2 idegesítő tulajdonsága, de élvezet vele szerkeszteni, viszont ő is a területi beállítások szerint mentett ANSIban.
7

Notepad++

janoszen · 2007. Jún. 25. (H), 09.57
Notepad++ vagy ha komolyan gondoltad a fejlesztést, akkor esetleg Eclipse SDK.
9

Lol

inf · 2007. Jún. 25. (H), 12.10
eclipse sdk az tudtommal java, én meg phpzek. egyébként is netbeansezek majd, ha elkezdek javazni.
notepad++ra majd ránézek vmikor

szerk:
notepad++ban nem találtam semmi olyat, ami a text fájl mentésénél a kódolásra utalna.
a HTML-KIT, amit most használok meg azért sokkal komolyabb program, mint ez.
13

Nem egészen

janoszen · 2007. Jún. 25. (H), 16.25
Nem annyira LOL az, próbáld ki a PDT vonalt. A Notepad++-ban nem a mentésnél hanem valamelyik másik menüben kell állítani a kódolást.
14

notepad++

gex · 2007. Jún. 25. (H), 16.31
notepad++-ban a Formátum menüpontban lehet állítani, hogy windows/unix/mac formátum és ansi/utf8(bom nélkül)/stb kódolás legyen-e.
15

Nem tudom

inf · 2007. Jún. 26. (K), 09.27
Nálam csak a unix meg windows meg ezek vannak, a kódolás az nincs ott a format menüpontban. Milyen verziót használsz?
21

verzió

gex · 2007. Jún. 26. (K), 11.31
notepad++ v4.0.2

szerk: megtaláltam a telepítő fájlt, ha kell el tudom küldeni.
22

okés

inf · 2007. Jún. 26. (K), 12.11
rendben, vegyél fel msnre, laszlo.janszky kukac dzsíméjl dot kom
8

Mint a tenger

vbence · 2007. Jún. 25. (H), 10.09
Én Windowson Dreamweavert használtam, rendelkezik normális szövegkódolás kezeléssel. Most Xcode-ot.

Ha rákeresel valami olyasmire, hogy "syntax highlight editor" biztos kapsz egy tucatot. Az első lapon biztos lesz legalább egy, ami kezeli a kódolást.

Mit jelent ez? 2 funkció: Reinterpret (amikor egy fájlról feltételezzük a megadott kódolást, és úgy töltjük be) és Convert (egy megynitott fájl-t konvertálunk a megadott kódolásra, hogy a szöveges tartalom ne változzon). Különböző képpen kezelik az editorok ezeket a funkciókat. Például XCode-ban, ha UTF-8 -ban dolgozol, és van benne egy (Windows által hazsnált) "magyar idézőjel" nem hajlandó a fájlt ISO-8859-2 -re konvertálni amég van benne tartalom, ami nem reprezentálható abban. A Dreamweaver ilyen esetben kérdőjellel helyettesíti a cél kódolásban nem szereplő karaktereket. Az iconv (ami nem egy editor) tud olyat, hogy valami hasonló karaktert keres pl. ezeket a béna idézőjeleket kicseréli ASCII idézőjelekké.

Amúgy mi ez az ANSI őrület? Színkódokat, meg mindenféle kontrol szekvenciákat szeretnél elhelyezni a szövegben?
10

iconv

inf · 2007. Jún. 25. (H), 12.14
iconvt vágom mi, de amíg csak kérdőjel van a szövegben, addig felesleges azt használnom :-)
egyébként sem jó, mert én pontosan azt a karaketert szeretném, amit megadok, nem pedig hasonlót, ugyanis jelszó, meg felhasználónév nem az igazi, ha csak hasonló ^^
ansi az alap, amiben ment a notepad, az egy txt encode formátum vagy mi a rák. nah majd kicsit belemászok a dolgokba, aztán utána még írok a tapasztalatokról, de imho mindegyik szövegszerkesztő függ az oprendszer beállításaitól, szóval nem várok csodát.
11

Oprendszer

vbence · 2007. Jún. 25. (H), 12.41
Nem, egy jó szerkesztő működése sem függ az oprendszer beállításaitól. (Ha függne, akkor egyik program sem tudna például ISO-8859-2 -t használni.) Legfeljebb a billettyűzetkiosztást kapják az oprendszertől.

Mégegszer mondom: Dreamweaver. Ha kipróbáltad, és látod a gyakorlatban, hogy ennek hogyan kell mennie, kereshetsz egy ingyenes alternatyvát.
12

OK

inf · 2007. Jún. 25. (H), 14.07
jó, leszedem, kipróbálom, csak a te kedvedért, de a dw nem tartozik a kedvenc programjaim közé, megpróbálok inkább Xcodet szerezni windowshoz
ha esetleg xcode gyártóját megmondanád előrébb lennék, mert elég gyakori programnév ahogy nézem.

szerk:
lol, most nézem, hogy rossz fórumba írtam az egészet, sorry :-)
16

Nem nyerő

inf · 2007. Jún. 26. (K), 09.28
DWtől sem vagyok elvarázsolva, nagyon lassan töltődik be, és mentésnél unicode normalization form van, ami gondolom nem az, ami nekem kell. Máshol nem találtam encodingra utaló dolgokat. (CS3 tryout verzió)

szerk: Na most találtam olat, hogy page properties, ott tényleg lehet módosítani a dolgokat, viszont nagyon zavar, hogy ennyire lassú a progi, nekem szövegszerkesztő kell, és nem grafikus felületű webszerkesztő, majd azért megpróbálok hozzászokni.
17

UltraEdit 32

Max Logan · 2007. Jún. 26. (K), 09.57
UltraEdit 32 v13.10

Format:
- ANSI / ASCII
- UTF8
- UTF 16
- UTF8 - NO BOM
- UTF 16 - NO BOM
- UTF 16 - Big Endian
- UTF 16 - Big Endian - NO BOM
- Unicode - ASCII Escaped

Line Terminator:
- DOS Terminators CR/LF
- UNIX Terminators LF
- MAC Terminators CR
18

Nem

inf · 2007. Jún. 26. (K), 10.12
Nem nyert, az ő betű hullámos benne, nem magyar ő. Meg állandóan DOS formatba akar konvertálni stb.. Persze kipróbáltam azt is, ott is hullámos, szóval ez gagyi. Hex editornak jó volt anno, de másra nem.
19

Működik ...

Max Logan · 2007. Jún. 26. (K), 10.26
Működik rendesen. Én UTF-8-ba mentek BOM nélkül és jók az ékezetek.

Nyomjál F12-t és ott tudod beállítani, hogy milyen formátumba mentsen. Utána ha azt a file-t töltöd be, akkor már a mentésre kattintva ugyúgy menti (ha pedig UNIX sortöréses file-t töltesz be, akkor megkérdezi, hogy konvertálja-e).
20

megpróbálom

inf · 2007. Jún. 26. (K), 11.10
Te windows vagy linuxot használsz, mert én windowst, és ott hullámos őnek látszik.

szerk:
lol, és tényleg jó
igazából begépelésnél hullámos ő meg kalapos ű van, de mentés után már rendes, köszi.
most azt nézegetem, hogy mi van akkor, ha a területi beállításokat visszarakom angolra, akkor is működik e, mert ha igen, akkor jó kis progi
23

Jaja

inf · 2007. Júl. 9. (H), 22.16
Köszi, notepad++ jobban bejött, ott most ANSI - UTF-8 BOM nélkülben mentek, és megy minden tökéletesen, szóval örülök, mint majom a farkának :)
24

idézőjel

Joó Ádám · 2007. Júl. 9. (H), 23.18
Az iconv (ami nem egy editor) tud olyat, hogy valami hasonló karaktert keres pl. ezeket a béna idézőjeleket kicseréli ASCII idézőjelekké.


Béna? Pedig ez az idézőjel. A klaviatúrád 1-es és 2-es billentyűjén azok egy szögperc és szögmásodperc.