ugrás a tartalomhoz

Archívum - Jún 19, 2013

statcounter?

H.Z. · 2013. Jún. 19. (Sze), 07.48
Tudja valaki, hogy mi történt a statcounter.com oldallal?
Néha kénytelen vagyok őket használni, hogy megtudjam, milyen linkről érkeznek látogatók az oldalamra. Tegnap még élt, most meg mintha a DNS bejegyzése is eltűnt volna. :(
 

Adatelemzés

csla · 2013. Jún. 19. (Sze), 00.54
Sziasztok!

Adott egy MySQL vagy PostgreSQL tábla, ami eseményeket tartalmaz, nagyjából 2 és fél milliót. Az egyszerűség kedvéért legyen benne két mező: esemény időpontja, objektum azonosítója (amivel az esemény történt).
A feladat az, hogy megkeressem azokat az objektumokat, amelyekkel gyakran történik meg nagyjából egy időben az esemény.

Én első közelítésben arra gondoltam, hogy készítek egy lekérdezést (MySQL verzióban), amelyik összeszedi, hogy azonos perceken belül mely objektumokkal történt esemény, és ezekben keresek ismétlődő mintákat. Valahogy így:
SELECT perc,GROUP_CONCAT(objektum ORDER BY objektum separator ",") FROM esemenyek GROUP BY perc
Egyből látszik a hátrány: csak azok az esetek gyűjthetők ki ezzel, amelyeknél nem "lóg át" másik percbe egy-egy elvileg oda kapcsolódó esemény. Persze ha elég gyakori az eset, akkor valószínű, hogy találunk olyat, aminél nem lóg át, és ez már részleges eredményt hozhat, találhatunk párat. Feltéve persze, ha van egyáltalán ilyen... ezt sajnos nem tudjuk.

Ti hogyan állnátok neki? Van ilyesmire bevált módszer, eljárás?

(A kategóriaválasztás esetleges, a téma ebben a tálalásban inkább elméleti, de a megvalósítás - az adatbázisokon kívül - PHP-ben kell/lesz.)