Szövegfelhő (szó-gyakoriság) lekérdezése

krisy · 2010. Aug. 27. (P), 10.11

Sziasztok!

Adott néhány százezer dokumentum, melyekben a felhasználó kereshet szavakra, így kap egy találat-halmazt.
Ebből a találat halmazból szeretném lekérdezni a leggyakrabban előforduló szavakat, relatív gyorsan (összemérhetően egy web oldal betöltésével, tehát mondjuk 10-20mp maximum).

A kérdésem az lenne, hogy Ti találkoztatok már ezzel a problémával, van ennek valamit out-of-the-box megoldása? :-) Vagy tudtok valami jó adatszerkezetet ajánlani a tároláshoz?

Egyelőre a dokumentumok tárolását MySQL-lel, vagy Lucene-nel gondoltam megcsinálni (a gyors kereshetőség miatt).

Köszi!

■

Adatbázisok

csirip

Friss blogmarkok

Web Akadálymentesítési Útmutató (WCAG) 2.1 – nyilvános munkaterv – Megjelent a WCAG (Web Akadálymentesítési Útmutató) 2.1 nyilvános munkaterv (0)
MongoDB Apocalypse Is Here as Ransom Attacks Hit 10,000 Servers – Több tízezer védtelen MongoDB szerverre csaptak le hackerek (2)
12 Signs You’re Working in a Feature Factory – A cél nélküli funkciógyártás néhány tünete (0)
Translatable, custom dates in Twig templates of Drupal 8 – Saját dátumok megjelenítése, fordíthatóan a Drupal 8 smink rétegével dolgozva (0)
NativeScript – Cross-Platform Native Development with Javascript – Fejlesszünk natív mobilalkalmazást JavaScripttel (0)
GitHub Security Update: Reused password attack – Érdemes bekapcsolni a kétfaktoros azonosítást, ha a GitHub jelszavunkat más oldalakon is újra felhasználtuk (17)
UX Design könyv – Hogyan tervezz felhasználóbarát és szerethető alkalmazásokat? (0)
Introducing unlimited private repositories – Megváltozik a GitHub díjszabása: minden előfizetéshez korlátlan számú privát repository jár (0)
Drupal 8 Twig: add custom CSS classes to menus (based on menu name) – Saját elképzeléseink szerinti CSS osztályok (automatizált) hozzáadása a Drupal 8 menüihez (0)