Comunque vi ricordo che la soluzione migliore è di utilizzare OkHttp per scaricare la pagina, poi utilizzare la libreria jTidy per convertire il codice HTML in XHTML e poi quindi utilizzare un parser XML per analizzare la pagina.
La libreria JSoup infatti sembra avere dei limini, metodi ancora non implementati, e alcuni bug irrisolti.
io ho utilizzato la libreria jsoup perchè aveva degli esempi abbastanza chiari e assomiglia ad una che usavo in vb.net.
Per quello che faccio io potrebbe bastare, ma darò uno sguardo pure alle altre soluzioni