Keresők vs. xhtml
Kapcsolódik az egyik lenti fórumhoz:
Van egy oldalam, ami xhtml fájlokból rakódik össze (az állandó tartalom frissítése miatt, non-adatbázis). A problémám az, hogy a google csak a rootot látja (www.weblap.hu, www.weblap.hu/index.shtml), ezt kiadja elég jó helyen, de ennyi. A többi oldalt (www.weblap.hu/aloldal.xhtml) egyáltalán nem. Szintén hasonló a helyzet az includes xhtml-ekkel.
Egy másik fórumban már volt róla szó, de továbbra sem nagyon látom, hogy is van ez... Az xhtml kiterjesztés miatt lehet?
■ Van egy oldalam, ami xhtml fájlokból rakódik össze (az állandó tartalom frissítése miatt, non-adatbázis). A problémám az, hogy a google csak a rootot látja (www.weblap.hu, www.weblap.hu/index.shtml), ezt kiadja elég jó helyen, de ennyi. A többi oldalt (www.weblap.hu/aloldal.xhtml) egyáltalán nem. Szintén hasonló a helyzet az includes xhtml-ekkel.
Egy másik fórumban már volt róla szó, de továbbra sem nagyon látom, hogy is van ez... Az xhtml kiterjesztés miatt lehet?
.xhtml?
igen de
keresők
a kiterjesztésnek -tudomásom szerint- mindegy, akár .bakfitty is lehetne, a file tartalma a lényeg. (amennyire én tudom)
kiterjesztések
ha saját szervered van, akkor persze a .bakfitty kiterjesztést is beállíthatod.
apache webszerver esetén, ha minden igaz, ezt a DirectoryIndex-nél kell beállítani.
gex
Már miért ne...
Wiki
Erről jó lenne egy pár soros kis cikk a Wikibe. Szerintem valahová a Keresők alá kellene tenni, mondjuk "Beágyazott fájlok elrejtése a keresők elől" címmel.
.html
Zsolt: ezek szerint jól tudom, h. a kiterjesztés mind1?
Hát..
Ha ő pl. PHP include()-ról beszél, akkor szerintem kicsit más a helyzet, úgyhogy valaki erősítsen meg, hogy miről beszélünk :)
Editke: nem valószínű, hogy pont erről tudnék írni, régen volt már az SSI ahoz.
ssi
az oldal egyébként csak (x)html, php, sql nem játszik.
phpben szintén
gex
hm
Akkor rosszul tudom?
Működik html-el is
egy ("mintanyádnak" :) ) magyarázat
Úgy kellene ezt az egész adatbázis (adatok) és kereső robotok dolgot felfogni, mit egy boltot, amelynek van kirakata, eladótere és raktára.
A raktárban vannak az áruk (adatok). Te mint vásárló, képes vagy a nyitott ajtó(ko)n keresztül bemenni az üzletbe, vagy ha céltudatos vásárló vagy akkor, egyenesen ahoz az áruhoz mész az üzlethelységben, ami téged érdekel.
Ebben a felállásban a keresőrobot egy olyan vásárló, aki csak a kirakatot látja, esetleg azon az ajtón tud bemenni ahova ki van írva, hogy bejárat, de a raktárba nem tud/nem képes bemenni.
A vásárlási módszere pedig az, hogy először végiszalad a bevásárló utcában, és felméri, hogy hol vannak bejáratok, azután bemegy a listáján az első helyen szereplő bejáraton, ha ott további bejáratokat talán azt leteszi a listája végére. Ha úgy gondolja hogy végzett a bámészkodással (leindexelte az oldalt) veszi a "bejáratlistájának" következő elemét, és ott is jól szétnéz.
Ergo: csak azt fogja megtalálni/leindexelni amit kiteszel a kirakatba, esetleg ráírod, hogy bejárat. És ha még készítesz is egy bejáratot, akkor is elképzelhető, hogy majd csak napok, esetleg hetek múlva jut oda, hogy végignézze, mit is kínálsz abban az üzletben.
Magyarul: a kereső csak akkor fogja megtalálni az aloldalakat, ha a főlapodról hivatkozol rá, teszel ki egy rámutató linket (ráírod, hogy bejárat).
Fórumnál én ezt úgy oldanám meg, hogy kigyűjteném az 5-10
TikuVoltam
kösz tiku
játszuk el hogy én vagyok a keresőrobot
Az, hogy te szerver oldalon hogyan építesz fel egy lapot, hány include van nem érdekli a keresőt, mert nem tud róla. Ő csak a sima HTML kimenetet látja, azt képes feldolgozni...
Egy tipp:
Próbáld ki mit lát a kereső. Hülyén hangzik de próbáld meg a helyébe képzelni magad. Ezt úgy érheted el, hogy a böngésződben kikapcsolod a képek megjelenítését, a JavaScriptet és a CSS-t, a lényeg, hogy csak a tiszta HTML kimentet lásd, azt amit kiküldesz a böngészőnek. Vedd a kezdőoldaladat, gyűjtsd ki az összes hivatkozást valahova, pl. egy txt-be. Ha végeztél a kezdőoldallal, akkor vedd az első hivatkozást a listádról, gyűjtsd ki abból is a hivatkozásokat, de a lista aljára tedd... és így sorban tovább.
Néhány trükk amivel talán életszerűbbé teheted (esetlég még gyorsíthatod is) a dolgot
jó játékot
TikuVoltam
Próbáld ki mit lát a kereső...
Search Engine Simulator
Socket...
Ha meg van, hogy mit is kell keresni, akkor először is kapcsolódnia kell...
Ez ugye úgy történi, hogy a botunk fogja magát és nyit egy kapcsolatot az adott szerver felé a 80-as porton... A tárcsázott szerver erra annyit reagál, hogy ho-ho... valaki nézelődik... Mit is kell neki? Jahm, hogy ez.. De hisz ez PHP.. Akkor előbb értelmezzük.. Majd a kimenet kimegy a keresőbot felé válasz formájában.. Ő ezt ellenőrzi, kiértékeli, súlyozza, kihámozza a linkeket és, ahogy tiku is mondta, végignézi az összeset...
Szal gyak kb annyit "lát" egy weblapból, mint egy felolvasószoftver... Se JS, se ActiveX (ha jól tom), se flash, se semmi ilyesmi..
SZVSZ: tök mindegy, hogy mi és hogyan hozza létre a tartalmat... A lényeg kimenő (szöveges és értelmezhető) adat...