perl minta illesztés HTML kódra
sziasztok,
táblázatokat szertnék kinyerni egy html oldalból de sehogy se megy.
próbáltam mintaillesztést írni de valhol mindig megbukik,
próbáltam html::parser-t de az se jó (vagy én nem csinálom jól).
a lényeg van egy html kód:azt szertném hogy pl.: a 3. táblától adja vissza a tartalmat a 10. tábláig.
ha valaki tud erre valami megoldást, kérem írja meg.
előre is köszönöm
■ táblázatokat szertnék kinyerni egy html oldalból de sehogy se megy.
próbáltam mintaillesztést írni de valhol mindig megbukik,
próbáltam html::parser-t de az se jó (vagy én nem csinálom jól).
a lényeg van egy html kód:
<html>
<head>
...
</head>
<body>
...
lorem ipsum
...
<table>
<table>
</table>
</table>
<table>
<table>
</table>
</table>
<table>
<table>
</table>
</table>
...
mégtöbb tábla
...
<table>
<table>
</table>
</table>
<table>
</table>
</body>
</html>
ha valaki tud erre valami megoldást, kérem írja meg.
előre is köszönöm
tableparser
perlcookbook
másra való
csendesebben
xml != regexp
vitatkoznék azzal amit te írsz: az xml egy jelölőnyelv, hogy mire lehet használni, az egy dolog, alapvetőleg mégis jelölőnyelv. én akár magyar mondatokban is kifejtek neked egy reguláris kifejezést (pl.: "kezdődjön nagy A betűvel, és utána mindegy mi van"), vagy biztos sokféleképp leírhatóak, és maga a reguláris kifejezés pontosan erre valóm, de az xml egy teljesen más technológia. rengeteg minden épül(het), úgy mint xhtml, xslt, soap, wsdl, rss, akármi. az, hogy valamilyen formában le tudod írni xml-ben egy reguláris kifejezést (vagy akár nyelvet, bizonyára lehet kitalálni ilyen xml felépítést, pont azért, mert az xml elég sokoldalú, sőt talán van is, erről nem tudok), az nem az jelenti, hogy a két technológia azonos célt szolgál. (megj.: nem azt írtam, hogy nem lehet használni, azt írtam: nem arra való, vagyis nem arra találták ki. szvsz)
és csak még csendesebben megjegyzem: tanultam formális nyelvtanokat. elég tág témakör. (megboldogult Bach Iván is többszáz oldalt írt róluk) konkrétan mire akarsz utalni?
Új téma
kipróbálom
és jelzem hogy műkszik-e.
és köszönöm
HTML::TreeBuilder
http://search.cpan.org/~petek/HTML-Tree-3.23/lib/HTML/Element.pm
üdv.
nos sikerült
A TreeBuilder-el találkoztam, és mostmár a puszta kíváncsiság kedvéért ki is próbálom.
A TableContentParser-es megoldás ilyen lett:
Köszönöm mindenkinek a segítséget.