A mellékjelek mellőzéséről

Joó Ádám · 2010. Feb. 24. (Sze), 13.09

A List Apart tegnapi cikkében Carlos Bueno az accent folding technikáról, az ékezetekkel és egyéb mellékjelekkel való okos bánásmódról beszél.

Valljuk be őszintén: hányan használunk nagybetűket google-ös kereséseink alkalmával? Enélkül is működik, így miért fárasztanánk magunkat a shift lenyomásával. Ennél azonban sokkal rosszabb a helyzet, amikor a bevinni kívánt jel nem is érhető el a billentyűzetről, az alkalmazás azonban elvárja tőlünk a pontosságot.

A latinbetűs nemzeti írások majd mindegyike mellékjelek használatával oldotta meg a finom ejtésbeli különbségek jelölésének problémáját, ezek közül azonban nem mindegyik érhető el minden nemzeti billentyűzetkiosztásról, mitöbb, a felhasználóktól sem várható el, hogy pontosan megjegyezzék egy-egy név vagy szó idegen írásmódját.

Képzeljük el, hogy címjegyzékünk keresőmezejébe begépeljük a „lo” betűket. Ekkor Lorena Smith neve minden alkalmazásban meg fog jelenni az élő keresés eredményei közt, sokkal kevesebb fogja azonban felajánlani Fulanito Lópezt, Erik Lørgensent és James Löt.

Míg a kis- és nagybetűk közti különbség figyelmen kívül hagyására kényelmes megoldást biztosít a legtöbb platform, addig az a mellékjelek esetén erre nézve szinte semmilyen direkt támogatást nem kapunk. Mindezek ellenére s fentiek miatt jogos elvárás felhasználóink részéről.

Mióta globalizált életünk része a számítógép, azóta okoz mindennapos problémát az információcserében a világ írásrendszereinek és nyelveinek sokezres tömege. A Unicode terjedésével a problémák egy része megszűnni látszik: végre számíthatunk rá, hogy amit az egyik oldalon leírunk, az a másik oldalon is ugyanazt jelenti, ennél többre azonban alapvetésénél fogva nem képes, hisz elsődleges célja mindig is az interoperabilitás volt, így törvényszerűen örökölte a már akkoriban is több évtizedes és nyilvánvalóan elavult szabványok paradigmáit.

Ennek egyik, a nyugati írásrendszereket érintő szomorú következménye, hogy a hagyományos latin betűk és mellékjelekkel ellátott formáik között közvetlenül semmiféle formális kapcsolatot nem definiál, így kénytelenek vagyunk magunk előrukkolni a megoldással, vagy külső eszközt igénybe venni.

Előbbi minden valószínűség szerint a normalizálás lenne, mely során az előre összeállított mellékjeles karakterből, az alapbetűből és a mellékjelekből álló karaktersor keletkezik, amiből aztán kereséskor elhagyjuk az utóbbiakat. Mivel erre a legtöbb környezetben ugyanúgy nincs lehetőségünk, így egy fapados, de működősképes megoldás lehet kézzel hozzárendelni a szóbajöhető mellékjeles karaktereket ASCII párjukhoz. Ekkor érdemes lehet időről-időre átnézni, hogy milyen új, általunk eddig figyelmen kívül hagyott kombinációkkal próbálkoztak felhasználóink.

A külső eszközök esetén egyik lehetőségünk az International Components for Unicode (ICU), ez a C++/Java projekt, mely széleskörben nyújt megoldást az efféle problémákra, azonban meglehetősen nagy és komplex. A kevésbé elegáns, de gyors és egyszerű megoldás lehet a Perl és Python alatt elérhető Unidecode könyvtár, ami a megadott karakterláncot kísérli meg ASCII sztringgé konvertálni.

Tessék válogatni.

■

csirip

1

PHP

Poetro · 2010. Feb. 24. (Sze), 16.03

PHP alá létezik

Derik Rethans Transliteration PECL modulja,
intl PECL modul
Drupal alá a Transliteration modul,

A Drupal modul ugyanazt a kódot használja, mint a Perl-es Unidecode, természetesen átkonvertálva PHP-ra.

A hozzászóláshoz regisztráció és belépés szükséges
új téma

2

http://hu.php.net/manual/en/i

Tyrael · 2010. Feb. 24. (Sze), 17.07

http://hu.php.net/manual/en/intl.requirements.php
To build the extension you need to install the » ICU library of version 3.6+.
szoval az intl is az ICU-t hasznalja.
http://blog.igstan.ro/2009/02/mysql-transliteration-function.html
ez meg mokas lenne mysql-hez, de mikor jatszott vele 1 kollega, akkor nem tudta mukodesre birni.

Tyrael

A hozzászóláshoz regisztráció és belépés szükséges
új téma

Friss blogmarkok

Web Akadálymentesítési Útmutató (WCAG) 2.1 – nyilvános munkaterv – Megjelent a WCAG (Web Akadálymentesítési Útmutató) 2.1 nyilvános munkaterv (0)
MongoDB Apocalypse Is Here as Ransom Attacks Hit 10,000 Servers – Több tízezer védtelen MongoDB szerverre csaptak le hackerek (2)
12 Signs You’re Working in a Feature Factory – A cél nélküli funkciógyártás néhány tünete (0)
Translatable, custom dates in Twig templates of Drupal 8 – Saját dátumok megjelenítése, fordíthatóan a Drupal 8 smink rétegével dolgozva (0)
NativeScript – Cross-Platform Native Development with Javascript – Fejlesszünk natív mobilalkalmazást JavaScripttel (0)
GitHub Security Update: Reused password attack – Érdemes bekapcsolni a kétfaktoros azonosítást, ha a GitHub jelszavunkat más oldalakon is újra felhasználtuk (17)
UX Design könyv – Hogyan tervezz felhasználóbarát és szerethető alkalmazásokat? (0)
Introducing unlimited private repositories – Megváltozik a GitHub díjszabása: minden előfizetéshez korlátlan számú privát repository jár (0)
Drupal 8 Twig: add custom CSS classes to menus (based on menu name) – Saját elképzeléseink szerinti CSS osztályok (automatizált) hozzáadása a Drupal 8 menüihez (0)

tovább»

Könyvajánló

Cikkajánló

MadBence:
Aszinkron JavaScript programozás
aston:
A Symfony keretrendszer telepítése és bemutatása
Bártházi András:
CSS alapjai II.

Friss csiripek

további csiripek»

Aktív fórum témák

tovább

Új fórum témák

tovább

Archívum

július 2026
H	K	Sze	Cs	P	Szo	V
29	30	1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31	1	2

Weblabor

Keresés