ugrás a tartalomhoz

Keresők vs. xhtml

drumlin · 2006. Már. 14. (K), 11.43
Kapcsolódik az egyik lenti fórumhoz:

Van egy oldalam, ami xhtml fájlokból rakódik össze (az állandó tartalom frissítése miatt, non-adatbázis). A problémám az, hogy a google csak a rootot látja (www.weblap.hu, www.weblap.hu/index.shtml), ezt kiadja elég jó helyen, de ennyi. A többi oldalt (www.weblap.hu/aloldal.xhtml) egyáltalán nem. Szintén hasonló a helyzet az includes xhtml-ekkel.

Egy másik fórumban már volt róla szó, de továbbra sem nagyon látom, hogy is van ez... Az xhtml kiterjesztés miatt lehet?
 
1

.xhtml?

Kevlar · 2006. Már. 14. (K), 11.54
Miért adsz neki xhtml kiterjesztést? Simán .html.
2

igen de

drumlin · 2006. Már. 14. (K), 12.09
mivel nincs alatt db, valahogy létre kellett hoznom állandó tartalmat (fejléc stb). ezt ssi includes-sel csináltam meg és ez sajna nem működik sima html-lel...
3

keresők

winston · 2006. Már. 14. (K), 12.19
ez úgy működik, hogy a kereső találkozik az indexeddel (valami.hu, vagy valami.hu/index.html {vagy .php, .asp, akármi}) aztán -ha nem mondod meg neki, hogy indexeljen- akkor az azon levő (nem flash, nem javascript) linkeket bebarangolja, és indexeli (értsd: felkerül a keresőbe) ha a linkjeid csak flashel, vagy akármilyen nem html módon vannak, akkor nem fogja, csak a nyitóoldalt látni.

a kiterjesztésnek -tudomásom szerint- mindegy, akár .bakfitty is lehetne, a file tartalma a lényeg. (amennyire én tudom)
6

kiterjesztések

Anonymous · 2006. Már. 14. (K), 12.55
a kiterjesztések a webszerver beállításai miatt fontosak. ha egy könytárat kérsz le (a valami.hu is ilyen), akkor a webszerver dönti el - a beállításoktól függően -, hogy mit ad vissza. lehet ez az index.html, az index.php vagy index.* is.
ha saját szervered van, akkor persze a .bakfitty kiterjesztést is beállíthatod.

apache webszerver esetén, ha minden igaz, ezt a DirectoryIndex-nél kell beállítani.

gex
4

Már miért ne...

-zsolti- · 2006. Már. 14. (K), 12.46
...működne?
<!--#include file="header.html" -->
Egyébként az ilyen beágyazandó fájlokat amúgy se engedd naplózni (robots.txt-ből disallow), mert képzeld el, ha egy ilyen jelenik meg találatként a keresőbe: csak egy menüsort vagy egy láblécet lát aki rákattint, nem egy valódi lapot. Naplózni csak azokat engedd, ami "teljes" oldal, ott viszont "index, follow" a metába. A kiterjesztés pedig legyen mindenhol nyugodtan .html.
5

Wiki

Edit · 2006. Már. 14. (K), 12.54
Kedves Zsolt,

Erről jó lenne egy pár soros kis cikk a Wikibe. Szerintem valahová a Keresők alá kellene tenni, mondjuk "Beágyazott fájlok elrejtése a keresők elől" címmel.
7

.html

winston · 2006. Már. 14. (K), 12.56
látom a nevelés megkezdődött :)

Zsolt: ezek szerint jól tudom, h. a kiterjesztés mind1?
9

Hát..

-zsolti- · 2006. Már. 14. (K), 13.02
...lehet, hogy elbeszélünk egymás mellett, én azt vettem ki a kérdező szavából (lehet hogy hibásan), hogy SSI-t használ. Erra írtam példát, abban lehet html-t beágyazni, txt-t, vagy amit akar.
Ha ő pl. PHP include()-ról beszél, akkor szerintem kicsit más a helyzet, úgyhogy valaki erősítsen meg, hogy miről beszélünk :)

Editke: nem valószínű, hogy pont erről tudnék írni, régen volt már az SSI ahoz.
10

ssi

drumlin · 2006. Már. 14. (K), 13.05
csak azért kell az includes (pont ugy használom, ahogy irtad, csak xhtmllel), hogy fix tartalmat tudjak létrehozni (menu, labléc stb).

az oldal egyébként csak (x)html, php, sql nem játszik.
12

phpben szintén

Anonymous · 2006. Már. 14. (K), 13.27
php-ben is be lehet ágyazni akármit (.html, .txt), csak ha annak tartalma nincs <?php, ?> jelek között, akkor egyből a kimenetre megy.

gex
8

hm

drumlin · 2006. Már. 14. (K), 13.02
Nekem mintha nem működött volna sima html-lel az includes (ezt is olvastam mindenhol).

Akkor rosszul tudom?
14

Működik html-el is

pint3r · 2006. Már. 15. (Sze), 10.12
Pedig működik html-el is. Korábban ritkán változó, de változtatható tartalmat html-ekben tároltam és adminból a fájlt lehetett módosítani, amit a megjelenítő rész egy php include-al húzott be és jelenített meg egyből.
11

egy ("mintanyádnak" :) ) magyarázat

tiku I tikaszvince · 2006. Már. 14. (K), 13.19
Megpróbálom úgy megfogalmazni, mintha anyukámnak akarnám elmagyarázni :)

Úgy kellene ezt az egész adatbázis (adatok) és kereső robotok dolgot felfogni, mit egy boltot, amelynek van kirakata, eladótere és raktára.
A raktárban vannak az áruk (adatok). Te mint vásárló, képes vagy a nyitott ajtó(ko)n keresztül bemenni az üzletbe, vagy ha céltudatos vásárló vagy akkor, egyenesen ahoz az áruhoz mész az üzlethelységben, ami téged érdekel.

Ebben a felállásban a keresőrobot egy olyan vásárló, aki csak a kirakatot látja, esetleg azon az ajtón tud bemenni ahova ki van írva, hogy bejárat, de a raktárba nem tud/nem képes bemenni.
A vásárlási módszere pedig az, hogy először végiszalad a bevásárló utcában, és felméri, hogy hol vannak bejáratok, azután bemegy a listáján az első helyen szereplő bejáraton, ha ott további bejáratokat talán azt leteszi a listája végére. Ha úgy gondolja hogy végzett a bámészkodással (leindexelte az oldalt) veszi a "bejáratlistájának" következő elemét, és ott is jól szétnéz.
Ergo: csak azt fogja megtalálni/leindexelni amit kiteszel a kirakatba, esetleg ráírod, hogy bejárat. És ha még készítesz is egy bejáratot, akkor is elképzelhető, hogy majd csak napok, esetleg hetek múlva jut oda, hogy végignézze, mit is kínálsz abban az üzletben.
Magyarul: a kereső csak akkor fogja megtalálni az aloldalakat, ha a főlapodról hivatkozol rá, teszel ki egy rámutató linket (ráírod, hogy bejárat).

Fórumnál én ezt úgy oldanám meg, hogy kigyűjteném az 5-10
  • legfrissebb témát
  • legolvasottabb témát
  • legutoljára nyitott témát
  • stb


TikuVoltam
13

kösz tiku

drumlin · 2006. Már. 15. (Sze), 02.17
az aloldalra nyilván van hivatkozás. mondjuk a menu az include fajlban van, ami esetleg beszivathat.
15

játszuk el hogy én vagyok a keresőrobot

tiku I tikaszvince · 2006. Már. 15. (Sze), 10.40
Ha van hivatkozás az aloldalakra, akkor ne idegeskedj, minden idő kérdése.
Az, hogy te szerver oldalon hogyan építesz fel egy lapot, hány include van nem érdekli a keresőt, mert nem tud róla. Ő csak a sima HTML kimenetet látja, azt képes feldolgozni...

Egy tipp:
Próbáld ki mit lát a kereső. Hülyén hangzik de próbáld meg a helyébe képzelni magad. Ezt úgy érheted el, hogy a böngésződben kikapcsolod a képek megjelenítését, a JavaScriptet és a CSS-t, a lényeg, hogy csak a tiszta HTML kimentet lásd, azt amit kiküldesz a böngészőnek. Vedd a kezdőoldaladat, gyűjtsd ki az összes hivatkozást valahova, pl. egy txt-be. Ha végeztél a kezdőoldallal, akkor vedd az első hivatkozást a listádról, gyűjtsd ki abból is a hivatkozásokat, de a lista aljára tedd... és így sorban tovább.

Néhány trükk amivel talán életszerűbbé teheted (esetlég még gyorsíthatod is) a dolgot
  • ha olyan linkkel találkozol, ami már szerepel a listádban, mondjuk háromszor, akkor az első előfordulását vedd előrébb a sorban 1 helyel.
  • egy lap feldolgozásakor először azokat a linkekeket vedd fel a listára, amelyek H1 tagban vannak, majd a H2, H3, stb.

jó játékot

TikuVoltam
16

Próbáld ki mit lát a kereső...

-zsolti- · 2006. Már. 15. (Sze), 11.42
17

Search Engine Simulator

laji · 2006. Május. 4. (Cs), 21.04
Hát... szvsz rosszul működik. A gugli sokkal többet lát belőle, mint amit ez az utánzó (simulator) mutat.
18

Socket...

Pred · 2006. Május. 4. (Cs), 22.16
Mivel a keresőbotok is csak gépek, ezért egyrészt tudniuk kell, hogy mit keresnek (URL, amit elvileg DNS szerverekről is kaphat)..

Ha meg van, hogy mit is kell keresni, akkor először is kapcsolódnia kell...
Ez ugye úgy történi, hogy a botunk fogja magát és nyit egy kapcsolatot az adott szerver felé a 80-as porton... A tárcsázott szerver erra annyit reagál, hogy ho-ho... valaki nézelődik... Mit is kell neki? Jahm, hogy ez.. De hisz ez PHP.. Akkor előbb értelmezzük.. Majd a kimenet kimegy a keresőbot felé válasz formájában.. Ő ezt ellenőrzi, kiértékeli, súlyozza, kihámozza a linkeket és, ahogy tiku is mondta, végignézi az összeset...

Szal gyak kb annyit "lát" egy weblapból, mint egy felolvasószoftver... Se JS, se ActiveX (ha jól tom), se flash, se semmi ilyesmi..

SZVSZ: tök mindegy, hogy mi és hogyan hozza létre a tartalmat... A lényeg kimenő (szöveges és értelmezhető) adat...