ugrás a tartalomhoz

Szövegfelhő (szó-gyakoriság) lekérdezése

krisy · 2010. Aug. 27. (P), 10.11
Sziasztok!

Adott néhány százezer dokumentum, melyekben a felhasználó kereshet szavakra, így kap egy találat-halmazt.
Ebből a találat halmazból szeretném lekérdezni a leggyakrabban előforduló szavakat, relatív gyorsan (összemérhetően egy web oldal betöltésével, tehát mondjuk 10-20mp maximum).

A kérdésem az lenne, hogy Ti találkoztatok már ezzel a problémával, van ennek valamit out-of-the-box megoldása? :-) Vagy tudtok valami jó adatszerkezetet ajánlani a tároláshoz?

Egyelőre a dokumentumok tárolását MySQL-lel, vagy Lucene-nel gondoltam megcsinálni (a gyors kereshetőség miatt).

Köszi!