Karakterkódolás RSS_hez
Hali
Blog motort írtam magamnak, de az RSS/Atom feed résznél megakadtam. PHP file generálja a feed-et, http://valerauko.net/vblog/feed.php a címe (rss 0.91). ha még a végére biggyesztetek egy ?mode=atom-ot akkor az atom verziót írja ki, ?mode=rssverzió (rss091/rss092/rss10/rss20)-ra a megfelelő rss fajtát. az a gondom, hogy a blog többnyelvű, magyar, angol, és alkalmanként még japán tartalmak is lehetnek benne, ezért utf-8 kódolást használnék. viszont az adatbázisban latin2-hungarian-ci összevetés van használva. az adatbázisba beírásnál a php htmlentities()-el minden spec. karaktert (asszem) átjavít &...; formára. amikor kinyerem az adatbázisból, a feed-be html_entity_decode()-dal visszaalakítom a jeleket. a gond az, hogy így nem jelennek meg normálisan, ha meg nem decodeolom őket, akkor az első á-nál (vagy egyéb hasonlónál) XML parse errort ad...
milyen kódolást használjak és hogyan? előre is kösz a segítséget...
■ Blog motort írtam magamnak, de az RSS/Atom feed résznél megakadtam. PHP file generálja a feed-et, http://valerauko.net/vblog/feed.php a címe (rss 0.91). ha még a végére biggyesztetek egy ?mode=atom-ot akkor az atom verziót írja ki, ?mode=rssverzió (rss091/rss092/rss10/rss20)-ra a megfelelő rss fajtát. az a gondom, hogy a blog többnyelvű, magyar, angol, és alkalmanként még japán tartalmak is lehetnek benne, ezért utf-8 kódolást használnék. viszont az adatbázisban latin2-hungarian-ci összevetés van használva. az adatbázisba beírásnál a php htmlentities()-el minden spec. karaktert (asszem) átjavít &...; formára. amikor kinyerem az adatbázisból, a feed-be html_entity_decode()-dal visszaalakítom a jeleket. a gond az, hogy így nem jelennek meg normálisan, ha meg nem decodeolom őket, akkor az első á-nál (vagy egyéb hasonlónál) XML parse errort ad...
milyen kódolást használjak és hogyan? előre is kösz a segítséget...
Header
<description>
részhez:de...
a title-be is lehet rakni <![CDATA[]]>-t?