Ho una pagina HTML con contiene una singola tabella composta dai tag <TABLE>, <TR>, <TD> <COLSPAN=..> <ROWSPAN=..> e ovviamente </TABLE>, </TR>, </TD>.
All'interno di questa tabella e dei citati tag ci sono elementi che vorrei eliminare. Ad esempio (elenco parzialissimo) :
class = 'mat'
class="mat"
COLOR= "#000000"
id = 'nodecBlack'
ecc. ecc. ecc.
Con virgole, apici e spazi messi un po' a caso tanto per farmi dannare ;-)
Io vorrei LASCIARE solo <TABLE>, <TR>, <TD> <COLSPAN=..> <ROWSPAN=..>, </TABLE>, </TR> e </TD> in modo da avere una tabella pulita. Questa tabella è abbastanza facile da interpretare ei trasformare il contenuto fra i tag <TD> e </TD> in un elemento di un array bidimensionale.
Dim Contenuto(NumeroColonne,NumeroRighe) as string
Per adesso non ho trovato altra via che quella di utilizzare in modo massivo e per innumerevoli volte la funzione Replace(tag,"") ma, esaminando varie pagine HTML, salta sempre fuori qualche tag non considerato che mi fa saltare tutto.
La domanda è: esiste un modo migliore che prenda in considerazione tutti ma proprio tutti i casi di tag "spuri" e faciliti assai l'interpretazione dei contenuti della tabella ?
Grazie per l'attenzione.
All'interno di questa tabella e dei citati tag ci sono elementi che vorrei eliminare. Ad esempio (elenco parzialissimo) :
class = 'mat'
class="mat"
COLOR= "#000000"
id = 'nodecBlack'
ecc. ecc. ecc.
Con virgole, apici e spazi messi un po' a caso tanto per farmi dannare ;-)
Io vorrei LASCIARE solo <TABLE>, <TR>, <TD> <COLSPAN=..> <ROWSPAN=..>, </TABLE>, </TR> e </TD> in modo da avere una tabella pulita. Questa tabella è abbastanza facile da interpretare ei trasformare il contenuto fra i tag <TD> e </TD> in un elemento di un array bidimensionale.
Dim Contenuto(NumeroColonne,NumeroRighe) as string
Per adesso non ho trovato altra via che quella di utilizzare in modo massivo e per innumerevoli volte la funzione Replace(tag,"") ma, esaminando varie pagine HTML, salta sempre fuori qualche tag non considerato che mi fa saltare tutto.
La domanda è: esiste un modo migliore che prenda in considerazione tutti ma proprio tutti i casi di tag "spuri" e faciliti assai l'interpretazione dei contenuti della tabella ?
Grazie per l'attenzione.