ugrás a tartalomhoz

Az RSS olvasók visszafogják a webet

Hojtsy Gábor · 2004. Május. 5. (Sze), 09.49
A Wired nemrég megjelent cikke azt a problémát járja körül, mely a webszerverek elérhetőségét is veszélyeztetheti. A gondok az RSS használata körül jelentkeznek, azaz inkább annak megvalósítására vezethetőek vissza. Az RSS egy XML alapú szindikációs formátum, mely lehetővé teszi más webhelyek illetve magánszemélyek számára, hogy saját tartalmunkat újra publikálhassák, és egyszerűen olvashassák. Az a probléma, hogy a hibásan megírt RSS kliens programok túl agresszívak.

Egy felhasználó magától nem fogja fél óránként meglátogatni ugyanazt a weboldalt. Az RSS olvasók tipikus alapbeállítása viszont az, hogy fél óránként megnézik, hogy változott-e az RSS csatorna tartalma. Ezzel nem is lenne igazán baj, ha a helyi gépen gyorsítótáraznák az RSS tartalmat, és a tárolt állomány dátumát is elküldenék a kéréssel, hiszen akkor nem kellene a szervernek visszaadnia a tartalmat, ha az nem újabb. Ugyanígy probléma az is, hogy ha ugyan visszaadják a dátumot, de a kliens és nem a szerver órája szerint adják meg a legutóbbi változat tárolásának idejét. Ilyenkor az időzónákat is figyelembe véve mindenképpen fölösleges terhelésnek van kitéve a szerver.

Az RSS népszerűvé válásával egyre több felhasználó akarja ugyanazt a csatornát letölteni, és ez fokozott terheléshez vezet, mely nem jelentkezne, ha a látogatók hagyományos módon érnék el a weboldalakat. A rövid távú megoldás - ami végső soron több látogatót jelenthet oldalunkon -, hogy csak a rövid bevezetőket, illetve a címeket és linkeket tesszük be az RSS tartalomba. Ilyenkor az olvasóknak tovább kell klikkelniük a tényleges tartalomért.

Felmerült már olyan ötlet is, hogy egy peer-to-peer hálózatot kellene létrehozni, amelyben az RSS feedek megosztása lehetővé válna (az állománymegosztókhoz hasonlóan). Így csak néhányan próbálnák meg az eredeti szerverről letölteni a csatornát, míg mások már a többi hálózatban lévő gépen tárolt másolatot használnák. Ez valójában csak nagyon terhelt feedek esetében lehet szükséges, mint például a népszerű hírportálok.

Végősoron az igazi megoldást az jelentené, ha az RSS olvasók fejlesztői korrektul valósítanák meg a HTTP Last-Modified és If-Modified-Since fejléceinek támogatását.
 
1

Szerintem nincs teljesen igazuk

Bártházi András · 2004. Május. 5. (Sze), 10.43
Bár tényleg okozhatnak nagy terhelést az RSS olvasók, azért én nem hiszem el, hogy egy statikus (cacheelt) RSS feed kiszolgálása valódi probléma lenne. Ha egy RSS feed méretét és gyakoriságát összehasonlítjuk, azzal, hogy az oldalt nézi meg feleslegesen az adott ember naponta párszor és letölti a képeket, az egész oldal forrását, amit valószínűleg dinamikusan szolgál ki a szerver, SZVSZ a terheltség összemérhető, bár egy kis igazság lehet a cikkben, de nem hiszem, hogy drasztikus lenne a növekedés.

Az RSS feedek inkább azzal terhelik az oldalt, hogy több látogatót hoznak rá, nagyobb érdeklődést tudnak teremteni, olyan látogatókat is el lehet érni velük, akiket egyébként nem, mert nem látogatnák meg maguktól az oldalt. Ez azonban szerintem épp a web értékét, hasznosságát növeli, hiszen több emberhez jutnak el jobb tartalmak...

-boogie-
2

Hogy is javítsunk ezen?

js · 2004. Május. 5. (Sze), 11.06
Több hiba is van a feltételezésben. Előszöris olyan dolgokra hivatkoznak, amik nem bizonyítottak. Kétségtelen, hogy tapasztalataim csak három aggregátorra alapulnak (ez a NetNewsWire, a FeedDaemon és a NewsGator), de mindegyik szépen megérti az If-Modified-Since fejlécet.

Egyébként meg azt mondom, hogy minek mindig legenerálni a legújabb híreket, futtasson a szerver negyedóránként egy szkriptet egyszer, ami kirakja rendes xml vagy rss formába a feed-et. Akinek még ez is megterhelő, az emellé használjon célszoftvert (pl. fordított proxy-t, vagy csak statikus fájlokat kiszolgáló webszervert). Aki pedig a sávszélességből fogyott ki, az meg rakja fel az ilyen anyagát az Akamai-ra, vagy a tar.hu-ra, vagy akárhová, ahol a szerver bírja a gyűrődést.
---jul
3

Én is bűnös vagyok

Hojtsy Gábor · 2004. Május. 9. (V), 13.26
Azért is vetettem fel ezt a problémát, mert tudom, hogy én is hibás vagyok, hiszen készítettem már olyan RSS olvasót, amelyik nem kesselte a feedeket a lokális gépen, hanem mindig lekérte, aztán feltettem a TODO-ra a feladatot. Végülis működött :) A webes RSS olvasók egy része valóban nem kessel, mert gyorsan összedobták, és így kényelmesebb volt. Nem elsősorban az asztali programokkal van a probléma. A többi megjegyzéssel egyetértek különben.