Я пытаюсь получить все данные из таблицы баскетбольной ссылки (http://www.basketball-reference.com/leagues/NBA_2015_per_poss.html). Когда я использую XPath для получения данных, он входит в один длинный список. У меня есть метод «кусков», который будет делить список на несколько списков, но, поскольку в таблице есть пустые ячейки, метод выходит и делит список неправильно. Есть ли способ справиться с этим?Работа с пустыми ячейками с веб-страницы
0
A
ответ
1
Мое предложение: используйте pandas.DataFrame
. Он может загружать данные из многих источников, включая HTML.
Вы можете легко обрабатывать пустые ячейки с помощью метода fillna
.
Рассмотрим следующий пример:
import pandas as pd
# read_excel returns list of dataframes.
# In this case we know there is only one in the page
df = pd.read_html('http://www.basketball-reference.com/leagues/NBA_2015_per_poss.html',
attrs={'id': 'per_poss'})[0]
# the headers repeat every 20 lines, filtering them out
df = df[df['Rk'] != 'Rk']
# inserting 0 to empty cells
# could also use inplace=True kwarg instead of reassigning, or pass a
# dictionary to use different value for each column
df = df.fillna(0)
Смежные вопросы
- 1. wxPython GridSizer - работа с пустыми ячейками
- 2. ВПР с пустыми ячейками
- 3. Tableview с пустыми ячейками
- 4. UITableView появляется с пустыми ячейками
- 5. Java gridlayout с пустыми ячейками
- 6. Строковый текст с пустыми ячейками
- 7. Таблицы Dompdf с пустыми ячейками
- 8. Работа с пустыми списками
- 9. Количество строк с пустыми ячейками (Excel/VBA)
- 10. Excel Функция работает с пустыми ячейками
- 11. JOpenDocument: проблемы с пустыми строками и ячейками
- 12. Подмножество через несколько столбцов с пустыми ячейками
- 13. VBA Обработка ошибки Проблемы с пустыми ячейками
- 14. Поиск Дезеру с пустыми ячейками в листе
- 15. Работа с выделенными ячейками (RoR)
- 16. Работа с многомерным массивом с пустыми размерами
- 17. Работа с пустыми ячейками при импорте файла Excel с использованием EPPlus
- 18. Работа с пустыми объектами в массиве javascript
- 19. Работа с пустыми тегами в груше xml_serializer
- 20. Работа с пустыми объектами ассоциации Doctrine 2
- 21. написать таблицу с пустыми ячейками на основе словаря значений
- 22. Удаление строк с пустыми ячейками и критериями VBA
- 23. как создать сетку участков в Bokeh с пустыми ячейками
- 24. Нулевые значения при связывании с пустыми ячейками в Excel
- 25. Как работать с пустыми ячейками в файлах excel java
- 26. создать таблицу на основе базы данных с пустыми ячейками
- 27. PHP foreach array вывести на стол с пустыми ячейками
- 28. Экспорт excel в таблицу xml с пустыми ячейками
- 29. Дисплей таблицы сотовой таблицы CSS конфликтует с пустыми ячейками таблицы
- 30. jsPDF-AutoTable генерирует таблицу PDF с пустыми ячейками
хороший подход в самом деле! – SIslam
В таблицу не входят «пустые» ячейки, ячейки просто не отображаются. например четвертая строка на сайте имеет 0, 0, затем пробел для 3P, 3PA, 3P%. Это входит в таблицу как 0, 0, 4.5 (следующее значение после 3P%). И я получаю сообщение об ошибке «html5lib не найден, пожалуйста, установите его», даже если у меня установлен html5lib при запуске вашего кода –