Я пытаюсь отказаться от содержимого таблицы из URL-адреса с помощью java, но скребок, по-видимому, работает некорректно. Я использовал java-документы на inputstreamReader и других онлайн-примерах, но не смог понять, в чем моя проблема. Проблема в том, что inputstreamReader пропускает два столбца каждой четной строки в таблице, получая последний столбец. Каждая нечетная строка дает желаемые результаты. Ниже мой код и вывод .У меня проблема с InputstreamReader и html
Источник таблица выглядит следующим образом:
И, наконец, вывод выглядит следующим образом:
В перспективе HTML, каждый столбец в строке является метка, которая считывается в виде линий. Поскольку пропускаются два столбца, означает ли это, что inputStreamReader пропускает две строки? Я думал, что это будет проблема regEx, но это не может быть причиной, потому что остальная часть вывода правильная. Я хочу иметь возможность выводить или читать во всех строках и столбцах правильно, чтобы иметь возможность продолжить.
Дважды проверить регулярные выражения ... быть уверены, что они принимают учитывайте различия в синтаксисе для каждой записи в таблице (например, правдоподобные пробелы). – copeg