ugrás a tartalomhoz

Yahoo index növelés és Google News RSS

Hojtsy Gábor · 2005. Aug. 10. (Sze), 22.27
A Yahoo webes keresőjének fejlesztői a napokban jelentették be, hogy a robotjaik által összeállított index mérete immár túllépte a 20 milliárd oldalt. Ez látszólag túlszárnyalja a Google alig több mint nyolc milliárd oldalt lefedő indexét, ám kérdéses, hogy fontos-e a különbség, sőt van-e lényeges eltérés egyáltalán az indexek méretében. Szintén a napokban indította el RSS szolgáltatását a Google News webhely.

A Yahoo keresőblogban bejelentett index méretnövelés érdekes reakciókat váltott ki. Charlene Li a Forrester Research-től fontos megjegyzéseket tesz ezzel kapcsolatban blogjában. Mind a Google, mind a Yahoo oldaláról megismerve a történetet, kénytelen bennünket figyelmeztetni, hogy a két méretet meghatározó szám egyáltalán nem mérhető össze, hiszen teljesen más algoritmusokat használhat a két kereső a duplikátumok, kereső spamek és hasonlók kiszűrésére. Mindemellett a nagyobb indexméret a web peremterületeinek jobb lefedettségét jelezné, azaz a ritkább, specifikusabb keresések találatait javítaná főleg, a többinél csak a sokszázadik találat környékén bukannak fel új linkek. A Yahoo mindenesetre azt reméli, hogy a nagyobb index méret kellő publicitást ad a keresőnek, és sokan kedvet kapnak ahhoz, hogy kipróbálják, talán hosszabb távon is a keresőnél maradva.

A Google a napokban inkább a híroldalának szolgáltatásaiban újított, és régen várt, ám sokak által nem remélt RSS/Atom hírcsatorna szolgáltatással egészítette ki a Google News oldal képességeit. Mostantól a webhely oldalain mindkét népszerű formában elérhetjük a híreket, akár saját hírkereséseinket is a kedvenceink közé tehetjük RSS formában. A publikálási feltételek szerint kereskedelmi célra nem használhatjuk a csatornákat, valamint minden esetben megfelelő hivatkozásokat kell elhelyezni a forrásokra, a Google News-ra, és a használt keresőkifejezésekre is.

Ha azonban közelebbről is megnézzük a Google News által generált RSS/Atom kódot, akkor igencsak szörnyű részletekre lehetünk figyelmesek, táblázatokkal, lezáratlan cellákkal, idézőjelek nélkül használt paraméterekkel, numerikusan kódolt aposztrófokkal, és ahogy Phil Ringnalda is megjegyzi, az autodiscovery támogatás is teljesen hiányzik az oldalakról.

<br><table border=0 width= valign=top cellpadding=2 cellspacing=7>...
<font class=p size=-1><a class=p href=http://news.google.com/?ned=us&ncl=http://athensreview.com/articles/2005/08/10/news/news07.txt&hl=en><nobr><b>all 4,618 related</b></nobr></a></font>
 
1

<Nincs cím>

Anonymous · 2005. Aug. 11. (Cs), 07.48
szvsz nem kell pálcát törni egyik kereső fölött sem.
a google általában relevánsabb találatokkal rendelkezik, de ha jó összetett a keresőszó, akkor az is előfordul, hogy 0 a találatok száma.
ebből a szembpontból a yahoo a jobb. ott még összetett keresőkszóra is ad releváns találatot. legalábbis szerintem

mrbond