ugrás a tartalomhoz

Keresőrobotok és dinamikus tartalmak

Anonymous · 2005. Aug. 16. (K), 17.12
Hali,

Hogyan oldható meg hogy a robotok vhogy indexlni tudják a dinamikus tartalmakat? index, origo ... hogyan csinálják hogy a cikkeket keresők látják?
köszi
 
1

Tudják

Jano · 2005. Aug. 16. (K), 17.24
A keresők általában okosan felimerik az ilyet. De jobban szeretik ha szép URL-ekkel találkoznak! Érdemes ilyeneket használni mert az embereknek is jobb és az olvashato URL-ben találhato szavak általában elég jó sullyal számítanak a kereőkben.
3

hogy?

Anonymous · 2005. Aug. 16. (K), 17.28
ugy érted a db tartalmakat(pl cikk) generáljam ki kvtárakba statikus html-ekbe?
7

Nem

Jano · 2005. Aug. 16. (K), 18.38
Ahogy többiek írták a szép vagy olvasható vagy rövid URL az lehet dinamikus tartalmak előtt is.

A legenerálásnak csak akkor alkalmazható, hogyha az oldalon nincsen más dinamikus tartalom aminek változnia kell (pl legfrisseb hirek blokkja.) Ebben az esetben ennek annyi az előnye, hogy csökkented a szerver terehelését mert nem hívja meg a PHP értelmezét és adatbázis kezelőt.
2

indexelnek

Poetro · 2005. Aug. 16. (K), 17.28
A keresőrobotok indexelik a dinamikus tartalmakat is, amennyiben azok elérhetőek számukra. Azaz az oldalakra mutat link, és nem csak valamilyen JavaScript vagy Flash generálja a linkeket. A weblabort is szépen indexeli a google pedig itt tényleg csupa dinamikus tartalomról beszélünk. Volt már pár cikk is erről a weblaboron, hogy hogyan lehet elősegíteni, hogy minél jobb helyezést érjen el oldalunk a google ranglétráján. Érdemes ezeket áttanulmányozni.
--------
Poetro
4

aha

Anonymous · 2005. Aug. 16. (K), 17.43
aha, pl.:egy ilyen címen: http://weblabor.hu/levlistak/wl-offlista/2003/10/000964
a 000964 kvtárban van egy index.html, amiben statikusan tükrözi a db-ben lévő megfelelőjét, vagy index.php van ami az url behivására kiszedi,generálja a db-ből a az aktuális tartalmat?
"az amennyiben azok elérhetők számukra" ezt ugy érted hogy pl.
<a href="/vmi.php?t=1&r=2"> link </a> szerepel az oldalban akkor az elérhető,
és ha pl:
<a href="/vmi.php?t=".$_GET['t']."&r=2" > link </a> szerepel az oldalban akkor az már nem elérhető számukra?
5

nincs ott

Hojtsy Gábor · 2005. Aug. 16. (K), 17.58
Nincs ott az a konkrét mappa, csak úgy tűnik, mintha ott lenne. Számos módszer létezik, hogy látszólagos webcímeket működésre bírj. Lásd a rövid webcímekről szóló cikkünket.

A $_GET['t'] így ahogy ide írod nyilván nem fog megjelenni a kimeneten, csak annak a tartalma, gondolj csak bele egy kicsit jobban. A keresőnek mindegy, hogy az a paraméter mi alapján állt elő a PHP szkriptedben.

Mivel a témának nem volt köze az asztali alkalmazásokhoz, elmozgattam egy megfelelőbb helyre.
6

Rövid webcím

Poetro · 2005. Aug. 16. (K), 18.08
Jano is gondolom a rövid webcímekre gondol. Ilyen esetben is, ahogy a weblaboron is van a tényleges hívást az index.php kapja meg paraméterekként pedig az URL egyes elemeit a gyökértől kiindulva. Ezt, ahogy Jano is említette a keresőrobotok jobban szeretik, ugyanis nem csak pár számból és számára értelmezhetetlen karakterből áll az URL, hanem valami olyasmiből, amiből a tartalomra is lehet következtetni (nem véletlenül van az inurl direktíva a google-ben).
<a href="/vmi.php?t=".$_GET['t']."&r=2" > link </a>

Miből gondolod, hogy ezt a linket a google látja? A php ezt szépen kigenerálja behelyettesítve a t változó értékével és az URL-ed az először említett módon jelenik meg számára (ahogy számodra is, ha valaha is megnézted egy weboldal forrását), azaz ő azt se tudja hogy php-ban van írva a weboldalad. (A .php kiterjesztés semmit se jelent, lehet hogy mögötte ASP.NET-es kód van.)
--------
Poetro
8

<Nincs cím>

Fekete Ferenc GDA · 2005. Aug. 16. (K), 21.40
pontosan. A böngésző és a robot is egyszerű html-t kap, teljesen midnegy,h statikus vagy dinamikus módon van előállítva.
Az url-rewrite segíthet a jobb helyezésben a serp-eken, de nem létszükséglet.
9

index.php vs. rövid webcím vs. URL rewrite

kgyt · 2005. Aug. 17. (Sze), 14.17
Kiegészítés:

Nem feltétlenül az index.php-nek kell megkapnia az adatokat. Mivel a WL .htaccess-ben megadott URL Rewrite módszert alkalmazza a Drupal beépített eszközének segítségével (ha jól tudom), ezért az alapértelmezett index.php kapja az adatokat, ellenben akár más is lehetne a script neve, pl. default.pl...

--
Szeretettel: Károly György Tamás
kgyt(a)kgyt.hu - http://kgyt.hu
10

Tiszta php oldal / gugli

laji · 2006. Már. 12. (V), 03.24
Elnézést, hogy tavalyi levest melegítek fel, de nem sikerült választ kapnom a kérdésemre, pedig mindent elolvastam itt és az ajánlott hivatkozásokon.
A lapom tisztán php-ből épül fel, sima html tartalom nincs benne. Az ajánlott keresőre hangolós módszerekkel 1-2 hét alatt sikerült 4-5 helyet elfoglalnom az 1. tízből a guglin, de CSAK a META címkékben megadott szavakra, s a kezdőlapon kívül semmit sem néz meg a gugli. Értelemszerűen minden tartalom MySQL táblákban van, s erre kéne találatokat elérnem.
Próbaképp (lehelletnyire erőltetett megoldással) a tartalom egy részét kiírtam állandó html alakba is - 1 héten belül megjelentek rá a találatok.
Azt írjátok, hogy "szebb" oldalcímeket kéne használni. Bár kezdő vagyok, de szerintem egy látogatónak tök mindegy, mit ment el pl. könyvjelzőként, 10 vagy 100 betűs hivatkozást. A gugli gyakorlatát bírálni meg persze annyit ér, mint szidni az esőt.
Figyelembe véve, hogy...
1. egy csomó munkával járna a címek átalakítgatása, s bizonytalan az eredmény;
2. annyira pocsékok mégsem lehetnek a mostani oldalcímeim se, hogy EGYET SE nézzen meg közűlük a gugli a kezdőlapon kívül (pedig pl. mi lehet állandóbb attól a címtől, hogy kapcsolat.php - az elérhetőségem nem változik naponta...)
...tehát az merült fel bennem, hogy, mint részleges próbaként megtettem, php-vel kiíratom a táblák összes (lényeges) tartalmát állandó html alakban (ezt így bármikor egy kattintással frissíthetem), s lehetőleg eldugom a hozzáférést ezekhez a lapjaimon, mert egyébként nincs rájuk szükség (pl. fekete háttér előtti fehér képre css-ben megadott fehér betűkkel teszek ki ezekhez hivatkozást). Tudom, szakmailag ez szentségtörésként hangzik, de semmi jobbat nem tudtam kitalálni a gugli (szerintem) hibájának kivédésére.

Vagy van valakinek más ötlete?

Utóirat
A címről. Jellemzően a legtöbb (~80%) tartalom úgy jelenik meg a lapomon a látogatónak, hogy rákeres. Namármost: ha ebből következően az oldal címe, ahova ugrani fog, www.lapom.hu/talalat.php ?jellemzo1=mittomén &jellemzo2=anyámtyúkja stb. - hogy tudnék ebből "szép" címet varázsolni, mikor nem is én csinálom a címet? De még ha lehet is, akkor is főleg az zavar, hogy a gugli értelmetlen többletmunkára akar kényszeríteni.
11

Cikk...

janoszen · 2006. Már. 12. (V), 11.34
Üdv!

A te barátod ez a cikk: http://www.weblabor.hu/cikkek/rovidwebcim

Persze, ez a tartalmak linkjeinek az átalakítását még nem veszi le a válladról, de egy reguláris kifejezés replace-el meg tudod oldani, amikor a kimenetre kiírod.

A régi befele jövő linkekre meg adsz egy "moved permanently" headert. Ebből aztán a googe is tudni fogja, hogy az a régi tartalom, csak új címen.

Remélem, segített.
12

Szvsz...

-zsolti- · 2006. Már. 12. (V), 11.39
A lapom tisztán php-ből épül fel, sima html tartalom nincs benne.
Valamit azért csak generál nem? Nyomj egy jobbgomb/forrás megtekintését a lapon, na az ott html lesz, amit látsz. Az, hogy MySQL-ben, vagy akármiben tárolod-e, annak megint nincs szerepe, az a lényeg, hogy a látogató (és a bot) mit lát.

Azt írjátok, hogy "szebb" oldalcímeket kéne használni. Bár kezdő vagyok, de szerintem egy látogatónak tök mindegy, mit ment el pl. könyvjelzőként, 10 vagy 100 betűs hivatkozást.
Szeritnem nem tök mindegy, egyrészt, mert nem csak a könyvjelzőzésre kell gondolni. Egyszerűbb megjegyezni egy rövid, statikus címet, mint egy felparaméterezett hosszú sort. Másik, hogy a keresők is jobban szeretik a minél rövidebb, statikusnak tűnő címeket. Még jobb, ha a kulcsszavak is szerepelnek az url-ben, pl: www.vasbolt.hu/csavarok/onmetszo-csavar.html Ebben az esetben a kötőjel szóközt helyettesít, tehát az "önmetsző csavar" kulcsszóra máris jó lehet. De ha állításod szerint végigolvastad a témát, és a linkeket, erről kellett volna olvasnod.

egy csomó munkával járna a címek átalakítgatása, s bizonytalan az eredmény;
Ráhúzni egy mod_rewrite-ot, egy központi fájlból lekezelni és továbbítani a kéréseket szerintem nem nagy munka. Bizonytalan az eredmény: nálam ca. 60%-kal több keresőtalálat érkezik az oldalamra, mint annak előtte.

úgy jelenik meg a lapomon a látogatónak, hogy rákeres.
Na végre, hogy kinyögted :) Akkor ez esetben érdemes lenne készíteni egy olyan boxot, hogy pl: "most keresi ka többiek". Itt megjelenne mindig az utolsó 10 keresett kulcsszavad, rajta a linkkel, ami a találati oldaladra vezet. Így bármikor ha egy bot végignézi az oldalad, mindig fog találni be nem járt linkeket, s egy idő után már egész sok indexelt (találati)lapod lesz.

A rövid URL-t ettől függetlenül érdemes megoldani a keresésre is: www.lapod.hu/kereses/kulcsszo/param1/param2 A megvalósítást olvasd el a rövidwebcímes cikkben.
13

Access log? Mióta él a site, mekkora forgalommal?

Dualon · 2006. Már. 12. (V), 11.54
Ha teheted, nézd meg az access.log-ot, abból látni fogod, mely lapokon jártak a keresőrobotok. Érdemes kigyűjteni (pl. scripttel) táblázatba, mely robotok mit néztek, mikor, stb., mert úgy könnyebben megtalálod a rendszert az adataidban.

Ha a site-od nagyon friss, kicsit várj vele. Amennyire tapasztalom, a google a magyar domaineket pl. hátrébb sorolja .com-os megfelelőikhez képest, sőt, a fél-egy évnél idősebb domainek pagerank-je magasabb (spammer lapok elleni védekezés).

Szintén befolyásolja a PageRanked a rád mutató hivatkozások, ill. azok PageRank értéke. Ha friss a lap, feltehetően nem linkelnek rád túl sokan.
15

Access log

laji · 2006. Már. 12. (V), 12.30
Néztem - CSAK az index.php-t nézték a keresők. Azon túlmenően, hogy EGYETLEN szóra sem kaptam eredményt, ami a MySQL tábláimban szerepel (pedig site:enlapom.hu módon is próbáltam), 1 hónap után sem (napi 30-50 látogatóval), valamint 3 hónap után sem (másik lap, napi 10-20 látogató), még az ösztönzött a html-kiíratásos megoldásra, hogy egy harmadik lapom, ami nem php, s 2 nap alatt csaptam össze, 2 hónap alatt már vígan be lett járva a gugli által, s 3 az oldalrangja (PR), emezeknek pedig vaskos 0 :(
16

MySQL tábla

attlad · 2006. Már. 12. (V), 12.47
EGYETLEN szóra sem kaptam eredményt, ami a MySQL tábláimban szerepel

A keresők nem keresnek közvetlenül a te MySQL adatbázisodban. Mi a problémás oldal webcíme?
17

www.konyvpiac.atw.hu

laji · 2006. Már. 12. (V), 12.52
.
18

Session ID, ATW

attlad · 2006. Már. 12. (V), 12.59
Keresők nem szeretik az URL-ben átadott session azonosítót (PHPSESSID=... rész), azt jó lenne eltűntetni belőle. Illetve egy normális tárhelyre átköltöztetni az oldalt. Az ilyen ingyenesek nem túl keresőbarátak.
14

Köszönöm!

laji · 2006. Már. 12. (V), 12.20
Köszönöm mindhárom választ. Az említett cikkeket olvastam. Figyelembe véve, hogy mennyit kéne tanulnom ehhez, a szóban forgó lapom inkább az említett módon oldom meg. Végül is ez elég hasonló a Zsolt ajánlotta dobozhoz (hatásában), csak az egész adatállományra kiterjed.
Készülök azonban egy másik lapot is csinálni, ott megpróbálkozom a rövid címekkel.
Lelkem mélyén persze abban bíztam, hátha vki mond egy 3. megoldást - de hát úgy látszik, ez van, tehát ezt fogom szeretni :).
19

Azért...

janoszen · 2006. Már. 12. (V), 13.40
Azért mindenféle szempontból sok csinálnivaló van az oldalon. Keresőgép optimalizálás tekintetében is. Meg más tekintetben is. Pl. kapcsold ki a képek megjelenítését és nézd meg az oldalt. Na, egy keresőgép kb. ennyit lát.
20

Még ezt súgja meg vki :)

laji · 2006. Már. 13. (H), 19.03
Bocsánat, remélem, utóljára értetlenkedem e tárgyban. Csak már korábban is szóba hoztam, de akkor sem értettem. Most magára a gugli működési elvére lennék kiváncsi - végül is azon tud töprengeni az ember, aminek érti az alapjait.
Tehát: világos, hogy a guglinak van valamilyen rálátása az adattárakban, táblákban (pl. MySQL) tárolt adatokra, hiszen (más, szerencsésebb halandóknak :)) megjelennek rá találatok. Értem, hogy a táblákhoz nem fér hozzá közvetlenül a gugli. De akkor hogy látja? Egy példa: apróhirdető oldal. Ott bármi szinte csak úgy jön elő, hogy rákeres az érdeklődő, tehát ha pl. egy hirdetésben az szerepel, hogy "ananász", olyan kész HTML lapot CSAKIS az kap kézhez, akarom mondani képernyőhöz, aki erre rákeresve lekéri ezt a lapot, s a kiszolgáló php-gépe kifejezetten ekkor, egyszeri, neki szóló példányban készíti el ezt a HTML-kimenetet, s csak az Ő gépére küldi el. Ha rajta kívül soha senki más nem fog rákeresni az ananászra, akkor az életben nem fog több ilyen szót tartalmazó lap keletkezni azon a kiszolgálón. A gugli (jó esetben) mégis megtalálja az ananászt. Hogyan? Jó lenne tisztában lenni vele.
21

Fekete Ferenc GDA · 2006. Már. 13. (H), 20.11
a google nem keres mysql vagy oracle vagy akármilyen sql adatbázisban és kész. Bármiylen weboldalt csinálsz, mindegy,h php, jsp, rails, stb, az html kimenetet ad. A google a megkapott html-t látja. ennyi.

Az apróhírdető odlalon úgy jöhetett el őaz ananász,h akkor, amikor a google indexelte, akkor elérhető volt valamelyik oldalon, de már nem. ezért van az,h amikor te odalátogatsz, már közvetlenül nem elérhető, bár a google cache-ben még ott van.

A google-ben van is egy "tárolt változat" link, amire ha kattintassz, a cacheben lévő odlalt tölti be, áradásul a keresett szavakat kiemeli.