Keresés stringben, bizonyos stringek között, hogy lehet?
Sziasztok!
file_get_contents-el felolvasok egy weboldalt, és abban vannak h1-es tagek és az összes h1 tag közötti szöveget ki szeretném gyűjteni egy tömbe.
Melyik a legalkalmasabb függvény(ek)?
Köszi.
■ file_get_contents-el felolvasok egy weboldalt, és abban vannak h1-es tagek és az összes h1 tag közötti szöveget ki szeretném gyűjteni egy tömbe.
Melyik a legalkalmasabb függvény(ek)?
Köszi.
Tök elemi és ellenvallt
(Lásd a Google keresés „php html dom parser” kifejezésre találatait.)
<h1.+?>Ehelyett nem inkabb
Hasonloan fura a groupban is a "+?", plusz ott meg a [\w\W] is lehetne akar egy "." is.
Es ahogy irtad is, html/xml-t-t nem parseolunk regexppel.
Ehelyett nem inkabb<h1.*>De
Nem vagyok regexp guru, de a
<h1.*>
nem lesz mohó? Vagyis a.*?
lenne a kevésbé mohó.Nem próbáltam ki, de a
.*
szerintem a lehető leghosszabb karakterláncra illeszkedne. (ha nem így van, akkor a fenti kérdőjeles (.*?
) változatot magyarázza meg valaki)Nem vagyok regexp guru, de a
Szerkesztés: Upsz, most meg arra nem figyeltem, hogy ezt nem nekem válaszoltad.
Dom
kb:
Ez szép, csak
->loadHTML($html)
-t írnék, és nagyobb oldal esetében érdemes inkább a->loadHTMLFile($url)
használata, hogy ne legyen egyszerre két helyre betöltve az adat. (Persze ehhez kell az allow_url_fopen is.)