ugrás a tartalomhoz

google nem látja az oldalt

Thom · 2007. Nov. 26. (H), 12.46
Több szerveren is jól működő cms-el új oldalt indítottam, ami kb. 2-3 hete üzemel. Itt valami átirányítási problémám lehet, a következőket tapasztaltam:
- opera 9-ben az oldal elsőre nem töltődik be (nincs semmi forrás) F5-re rendben betöltődik. FF-ban, IE-ben rendben megjelenik. FF-ban a response headereknél nem látok hibát.
- a validátor nem látják az oldalt, HTTP 302 státuszkódot ír ki.
- a google-ban egy hét után a találati lista elejére kerültem, tegnap megnézve sehol nincsenek az oldalak (célzott keresésre sem, mintha bannolt volna). Nem használok semmi google-trükköt, legalábbis szándékosan.
Mivel nem a domain gyökérben vannak a cuccok, hanem egy almappában, korábban elhelyeztem a gyökérben egy index.php-t, benne 'HTTP/1.1 301 Moved Permanently' és 'Location:..' fejlécekkel, ami a tényleges helyre mutat. A fentebbi opera hiba a tényleges fájlnevet beírva is jelentkezik. Saját log szerint a PHP mindig rendben lefut, a HTML a kimenetre kerül.
A tárhelyen Apache/2.2 és PHP/4.4.6-2+b1 van, ha ez számít valamit. Mivel ugyaez a kód más szerveren nem produkál ilyen hibát, épp valami szerveroldali problémára gyanakszom.

Tanácstalan vagyok, egy PHP bugot találtam, de az nem pont erre vonatkozik. Hálás lennék minden ötletért, különösen a google-ból eltűnés érint érzékenyen. Erről van szó:
http://www.ndk.hu illetve: http://www.ndk.hu/tp/index.php
 
1

Opera, Google

csla · 2007. Nov. 26. (H), 13.26
Nekem Opera 9.24 alatt betöltődik elsőre.
Google nem hiszem, hogy bannolt volna, mert a site:www.ndk.hu keresésre 112 db találatot ad.
2

csak a régebbi találatok vannak ott

Thom · 2007. Nov. 26. (H), 13.35
Opera 9.0.1-en néztem. A domainen régebben statikus oldalak voltak, a találati listán most csak ezek vannak - az új portálból semmi tartalom (1 hete még ott volt).
Valami biztos nem jó, mert a validátor sem látja a cuccot:
http://validator.w3.org/check?uri=http%3A%2F%2Fwww.ndk.hu%2Ftp%2Findex.php
3

Szolgáltatót kérdezted?

minczerl · 2007. Nov. 26. (H), 14.36
Nekem nemrég hasonló problémám akadt, és miután már nem volt semmi ötletem, User Agent Switcher FF kiterjesztésben felvettem a GoogleBot-ot (Googlebot/2.1 (+http://www.googlebot.com/bot.html)) és továbbra is 302-es hibakódot kaptam, ekkor "megvilágosodtam" mert tuti hogy nem nálam volt a gond, hanem valami szerveroldali probléma van a háttérben. A gyanúm beigazolodott, írtam a szolgáltatónak és megtalálták a problémát.
4

szolgáltató - én is erre gondoltam

Thom · 2007. Nov. 26. (H), 14.44
A szolgáltatót még nem abajgattam, de kimondatlanul én is ilyesmit sejtettem. Volt itt már php beállítási probléma is, akkor együttműködött. Írni fogok neki, azt hiszem - bajom nem lehet belőle... Csak előtte megnézem az User Agent Switcher -t, ha már felhívtad rá a figyelmet.
5

User Agent Switcher

Thom · 2007. Nov. 26. (H), 15.48
Feltettem az User Agent Switcher-t, de nem lettem okosabb tőle. FF-ban eddig sem jelentkezett a hiba, ha most googlebot-nak nevezem magam, abban most is lejön az oldal. Operában a hiba változatlanul fennáll, ott viszont nem tudom megnézni a headereket, mert ahhoz nincsenek ilyen jó kis kiterjesztések.
A szolgáltatónak mindenesetre írtam.
8

nem 302

minczerl · 2007. Nov. 26. (H), 17.27
Korrigálnék, rosszul emlékeztem a hibakódra, mivel 403-as hibaüzenetet kaptam. Elnézést.
6

302

vbence · 2007. Nov. 26. (H), 17.01
Milyen technikát használsz most az átirányításra? mod_rewrite vagy saját PHP küldi a kódot, esetleg ErrorDocument?

Amit én kaptam:

GET / HTTP/1.1
Host: www.ndk.hu

HTTP/1.1 302 Found
Date: Mon, 26 Nov 2007 14:42:15 GMT
Server: Apache/2.2
X-Powered-By: PHP/4.4.6-2+b1
Location: http://www.ndk.hu/tp/index.php
Content-Length: 0
Content-Type: text/html
Ami jó, mert megkapom az új URL-t, viszont erre:

GET /tp/index.php HTTP/1.1
Host: www.ndk.hu

HTTP/1.1 302 Found
Date: Mon, 26 Nov 2007 14:43:30 GMT
Server: Apache/2.2
X-Powered-By: PHP/4.4.6-2+b1
Set-Cookie: sid=3ff6244efc57e781238389ac487b4246; path=/
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
Set-Cookie: tps=tobacco%A4800%A4hu%A4HUF%A41196088216%A4%A40%A4ffffffffffffffff%A4; expires=Wed, 26 Dec 2007 14:43:36 GMT; path=/
Location: http://www.ndk.hu/tp/index.php
Content-Length: 0
Content-Type: text/html
Egy újabb redirect következik, ami viszont rekurzív (önmagára mutató)! Ha cookie-val kérem le az oldalt:

GET /tp/index.php HTTP/1.1
Host: www.ndk.hu
Cookie: sid=529f7e148dee80c62121c67e4b5a85d0

HTTP/1.1 200 OK
Date: Mon, 26 Nov 2007 14:52:32 GMT
Server: Apache/2.2
X-Powered-By: PHP/4.4.6-2+b1
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
Set-Cookie: tps=tobacco%A4800%A4hu%A4HUF%A41196088766%A4%A40%A4ffffffffffffffff%A4; expires=Wed, 26 Dec 2007 14:52:46 GMT; path=/
Transfer-Encoding: chunked
Content-Type: text/html

9744
<!--
      + - - - - - - - - - - - - - - - - - - - - - - - - - - +
      |    powered by:    T98s CMS System v2.5s  |
. . .
... akkor jön minden, de cookie nélkül ez egy végtelen rekurzív redirect. Így pedig érthető miért dobta ki a gugli a címeket az indexből. Regisztrálj a Webmaster Toolsba, akkor látod, hogy milyen időközönként jár a bot az oldaladon. Ha orvosoltad a problémát, akkor biztos visszakerülsz. Egyetlen kérdés, hogy ezt miért nem csináltad végig te magad?

Ha megvan a megdolás szivesen okulnánk belőle, hogy valami PHP (talán session autostarttal kapcsolatos) beállítás volt-e az ok, vagy szimpla tervezési hiba (nem gondoltad, hogy coockie nélkül is nézhetik az oldalt).
7

tanulságos okfejtés

Thom · 2007. Nov. 26. (H), 17.21
köszönöm, tanulságos okfejtés, még ma belemászok a kódjaimba. Csak valami utólagos (verzió)módosítás okozhatott galibát, mert ez a cucc máshol évek óta gond nélkül fut. A kuki detektálásnál nem csinálok redirektet, ha nincs, egyszerűen beállítok egy újat.
Feltétlen be fogok számolni, ha van valami.
A kérdésre: a hiba Operában jelentkezett csak FF-ban jó volt. Operához viszont nem ismerek olyan kiterjesztést, vagy módszert, amivel meg lehetne nézni a header infókat. De a Webmaster Tools-t kipróbálom.
9

végtelen redirect maradt benne

Thom · 2007. Nov. 26. (H), 23.45
Végülis meglett a hiba, a 'végtelen redirect' meglátás vezetett rá. Tervezési hiba volt benne egy korábbi módosítás mellékhatásaként, aminek csak adott beállítással volt hatása.
3 szintű menürendszer van, ahol bármely menüpont megadható kezdőoldalnak. A menüpontokat db-ből szedjük ki, ha van beállított kezdőoldal megadva, akkor a látogatót az 1. oldalnál (amikor sessiont kap) redirect-el átdobjuk a beállítottra. Tehát, ha ez a beállított kezdőoldal: 'index.php/fotema/altema', akkor az 'index.php'-re érkező user átkerül az 'index.php/fotema/altema'-ra (de az 'index.php/masiktema'-ra érkező nem, mert ő mélylinkre érkezett). Az a helyzet nem volt épp lekezelve, hogy ha az 'index.php' van kezdőoldalnak beállítva, és az user is az 'index.php'-re érkezett akkor is át akar dobni - ezúttal önmagára.
Így utólag banális, csak meg kellett találni - ráadásul ez nem a session/kuki kezelésnél, hanem a menü kezelésnél hibádzott.
Így most jól működik az Operában, látja a validátor, remélem, a google-ba is hamar visszakerülök.
Köszönöm a segítségeket.

Ps: közben megjött a szolgáltató válasza is - udvariasan eltanácsolt innen, gondolom, mert a hirtelen megugrott látogatottságunk miatt mostanában többször lehalt a szerver. (mondjuk tényleg durva forgalmat produlkálunk, a fenti hibától függetlenül is). Erről ennyit...
10

off: fölösleges funkciók versenye

vbence · 2007. Nov. 27. (K), 00.23
Nehogy magadra vedd, de a profilomban beállítom, hogy mivel jöjjön fel az oldal? Agyrém. :) Még véltetlenül sem - teszemaszt - megbookmarkolom a kedvenc oldalamat (a böngésző bookmark funkciójával, amit jól simerek), nem ehelyett beállítom az oldalon a profilomban (ahol még meg is kell keresni a funkciót), hogy ha ezt a címet írom be, akkor az jöjjön fel.
11

Persze, nem veszem...

Thom · 2007. Nov. 27. (K), 10.36
Persze, nem veszem, bár nekem mondtad ;) Amiről fentebb írtam - beállítható kezdőoldal - azt a szájt admin tudja kezeli, azaz a domaint meghívva egy megadott oldal töltődjön be mindenkinek elsőként: pl a hírek, vagy a termék katalógus, egy reklám akció idején az akció fogadó oldala. Ez szvsz. szükséges funkció és kell, hogy módosítható legyen (a szájt admin által). Használják is több helyen.
Más dolog, hogy a cucc elég sok funkciót tartalmaz, egy részük szükségessége talán vitatható. Van pl. valóban a látogató által választható saját kezdőoldal. Mindenestre megnéztem, vannak reg. felhasználók, akik állítottak be ilyen. Hozzáteszem, hogy a rendszert igyekeztem univerzálisra tervezni: itt egy közösségi portált működtet, máshol webáruházat, vagy céges domainre van téve. Így ami az egyik működési módban fölöslegesnek látszik, az más típusú használatnál kellhet.
Végül: az eltelt évek eredménye az a működés, amit láttál, közben folyamatosan mélyedtem bele a témába (az első változatok még szövegfájl alapú adattárolást használtak), azaz, "hobbyból" apránként írtam. Közben többször módosult az alapkoncepció, amit lehet, hogy nem sikerült a kódban mindenhol pontról pontra lekövetni.Jelen esetben is ilyen helyzet állt elő.
12

Tudom mire gondolsz

vbence · 2007. Nov. 27. (K), 11.00
Időről időre én is kidobok mindent, hogy helyet adjak az új koncepcióknak, megszabaduljak az idegesítő (be nem tervezett) hack-megoldásoktól az éppen aktuális rendszeben. De ez inkább szépsége a szakmának :)