ugrás a tartalomhoz

unicode karakerkészlet / utf8 kódolás

toxin · 2006. Aug. 2. (Sze), 21.50
rákerestem, nem volt ilyen általános téma :S de ha lenne vonjátok bele, és akkor elnézést


szóval ez egy olyan szöveg amiben elmagyarázzák miért nem töbnyelvű a lap,

üf

Mellékeltem a hindíre fordított szöveget. Szerintem oké a fordítás; volt pár
rész, ahol kissé szabadon kellett csinálnom, de nem rugaszkodtam el nagyon.
A nyelvezete számomra elég fura lett, mivel a magam irodalmi szanszkritos
szóhasználata mellé jópár angol szót is kénytelen voltam tenni bele -
végletek találkozása...

Ami a kódolást illeti, szerintem bármilyen unicode alapú, dévanágarí
karaktereket tartalmazó betűtípussal jól kell megjelennie. Én Arial Unicode
MS-ben írtam; ha WinXP van egy gépen, és telepítéskor kérték, hogy
támogasson egzotikus írásokat, akkor ez a font valószínűleg fent van. A
másik, amit a windows-zal szállítanak, a Mangal nevű, ez talán valamivel
több gépen található meg (?).

A magyar szöveget töröltem belőle, csak a két külön felirat mellett hagytam
meg, nehogy azok elkeveredjenek.



én: megjött fent említett dokumentum, OOWriter-be betölt, export html, megnéz kicsit kusza, javítgat, legyárt kimenet, íme

http://ideafontana.com/agra_web/hindi/

ugyan unicode-os érékekkel oldottam meg a forrásban, de legalább nemtudom elb*** a karakterkódolást, szerkeszteni, ilyesmi nem akarom, se módolni, üf-se, hátrány hogy így méretügyileg nagyobb, de nemvészes

vélemény a know-how-ról, ill forrásról, css-ről stb. ? érdekel mert ez az első ilyen munkám, ugyan 3órát töltöttem unicode-os manuálok olvasással de még bizonytalan vagyok, szóval örülök minden építő jellegű megjegyzésnek, pláne hogy lesz arab, japán és kinai verzió is :)
 
1

UTF-8 export

janoszen · 2006. Aug. 2. (Sze), 21.58
Igazából sztem export karakterkódolt fájlba, UTF-8 kiválaszt... és utána kézzel belerak a HTMLbe
2

karakterkódolással

toxin · 2006. Aug. 2. (Sze), 22.10
nem akarok semmi zürt, se Apache-al se brózerekkel, ami unicode karakterkódokkal van benne az-az ami, végigolvastam többek között

http://www.w3.org/International/tutorials/tutorial-char-enc/Overview.en.html

szakaszát, ill. ami konkrétan ide vonatkozik:
Entities and Numeric Character References (NCRs) alatti részt,

itt leírják az érveket ellene és mellette, szóval értem mit mondasz de szvsz így most nekem jobb lesz
3

Akkor

janoszen · 2006. Aug. 3. (Cs), 04.27
Akkor stripeld ki a HTML tageket és utána megint kösd bele. Így kiszűröd a fölöslegesen beletett span tageket. Egyébként nem tudom, ilyesmivel még nem játszottam. Nekem FF alatt normálisan megjelent. (Nem tudok hindiül, úgyh. "úgy nézett ki").
4

oksa

toxin · 2006. Aug. 3. (Cs), 07.18
megjön a többi nyelv, akkor majd azt teszem amit mondtál :)

ui: nagy ötlet volt ez-az UTF-8 kódolás, innen is gratulálok Ken Thompson-nak hozzá :) , de most komolyan :) csakmert eddig azt tudtam mit csinál, aztnem, hogy hogyan