Szövegfelhő (szó-gyakoriság) lekérdezése
Sziasztok!
Adott néhány százezer dokumentum, melyekben a felhasználó kereshet szavakra, így kap egy találat-halmazt.
Ebből a találat halmazból szeretném lekérdezni a leggyakrabban előforduló szavakat, relatív gyorsan (összemérhetően egy web oldal betöltésével, tehát mondjuk 10-20mp maximum).
A kérdésem az lenne, hogy Ti találkoztatok már ezzel a problémával, van ennek valamit out-of-the-box megoldása? :-) Vagy tudtok valami jó adatszerkezetet ajánlani a tároláshoz?
Egyelőre a dokumentumok tárolását MySQL-lel, vagy Lucene-nel gondoltam megcsinálni (a gyors kereshetőség miatt).
Köszi!
■ Adott néhány százezer dokumentum, melyekben a felhasználó kereshet szavakra, így kap egy találat-halmazt.
Ebből a találat halmazból szeretném lekérdezni a leggyakrabban előforduló szavakat, relatív gyorsan (összemérhetően egy web oldal betöltésével, tehát mondjuk 10-20mp maximum).
A kérdésem az lenne, hogy Ti találkoztatok már ezzel a problémával, van ennek valamit out-of-the-box megoldása? :-) Vagy tudtok valami jó adatszerkezetet ajánlani a tároláshoz?
Egyelőre a dokumentumok tárolását MySQL-lel, vagy Lucene-nel gondoltam megcsinálni (a gyors kereshetőség miatt).
Köszi!