MYSQL-Hasonló szövegek keresése
Sziasztok!
Van MYSQL-ben valami olyan lehetőség amit pl. egy google is használ.
Spammelőket keresek a saját rendszeremben, de csak akkor tudom elcsípni ha betű pontosan ugyanazt írják.
Ha már néhány betűt megváltoztatnak, akkor már nem tudom leszűrni.
Tehát van -e olyan eljárás, amivel nem pontos egyezést keresek (ebben beleszámolom ezt is: LIKE %szöveg%), hanem ha a szöveg mondjuk 90%-95%-ban megegyezik valamivel, vagy egy másikkal.
Tehát megtaláljam azt is amikor pl. csak egy megszólításban tér el a szöveg.
Előre is köszi a segítséget.
Zoli
■ Van MYSQL-ben valami olyan lehetőség amit pl. egy google is használ.
Spammelőket keresek a saját rendszeremben, de csak akkor tudom elcsípni ha betű pontosan ugyanazt írják.
Ha már néhány betűt megváltoztatnak, akkor már nem tudom leszűrni.
Tehát van -e olyan eljárás, amivel nem pontos egyezést keresek (ebben beleszámolom ezt is: LIKE %szöveg%), hanem ha a szöveg mondjuk 90%-95%-ban megegyezik valamivel, vagy egy másikkal.
Tehát megtaláljam azt is amikor pl. csak egy megszólításban tér el a szöveg.
Előre is köszi a segítséget.
Zoli
Nincs
MySql-ben nincs erre kész megoldás.
Egy alap elképzelés (egyáltalán nem pontos, csak elindulni segít):
- az "A" szövegből kigyűjtöd a teljes szavakat (whitespace mentén darabolod és ha hosszabb, mint x karakter, akkor szó)
- "A" szövegből kigyűjtöd azt is, hogy melyik szó hányszor szerepel
- "B" szövegben megszámolod, hogy a kigyűjtött szavak hányszor szerepelnek
- "B" szövegből kigyűjtöd azokat, amik nincsenek "A"-ban
- összevonod az eredményt.
Eléggé erőforrásigényes mutatvány, szóval óvatosan.
Lehet
Arra számíts, hogy nem lesz gyors, meg kicsit gondolkodni kell, mert számít, ugye, a karakterlánc hossza is az eltérés százalékának kiszámításakor.
PHP-ban is van ilyen függvény, de az még lassabb (mivel le kell "tölteni" az adatbázisból az adatokat).
jó ötlet :)
Fv törzs: