У меня есть огромная таблица HTML (около 500 000 строк), которую мне нужно преобразовать в файл JSON. таблица выглядит следующим образом:Преобразование HTML-таблицы в JSON
<table>
<tr>
<th>Id</th>
<th>Timestamp</th>
<th>Artist_Name</th>
<th>Tweet_Id</th>
<th>Created_at</th>
<th>Tweet</th>
<th>User_name</th>
<th>User_Id</th>
<th>Followers</th>
</tr>
<tr>
<td>1</td>
<td>2013-06-07 16:00:17</td>
<td>Kelly Rowland</td>
<td>343034567793442816</td>
<td>Fri Jun 07 15:59:48 +0000 2013</td>
<td>So has @MissJia already discussed this Kelly Rowland Dirty Laundry song? I ain't trying to go all through her timelime...</td>
<td>Nicole Barrett</td>
<td>33831594</td>
<td>62</td>
</tr>
<tr>
<td>2</td>
<td>2013-06-07 16:00:17</td>
<td>Kelly Rowland</td>
<td>343034476395368448</td>
<td>Fri Jun 07 15:59:27 +0000 2013</td>
<td>RT @UrbanBelleMag: While everyone waits for Kelly Rowland to name her abusive ex, don't hold your breath. But she does say he's changed: ht…</td>
<td>A.J.</td>
<td>24193447</td>
<td>340</td>
</tr>
Я хотел бы создать JSON-файл, который выглядит н так:
{'data': [
{
'text': 'So has @MissJia already discussed this Kelly Rowland Dirty Laundry song? I ain't trying to go all through her timelime...',
'id': 1,
'tweet_id': 343034567793442816
},
{
'text': 'RT @UrbanBelleMag: While everyone waits for Kelly Rowland to name her abusive ex, don't hold your breath. But she does say he's changed: ht…',
'id': 2,
'tweet_id': 343034476395368448
}
]}
Может быть, с некоторыми более переменных, включенных, но это должно быть само объяснить ,
Я уже рассмотрел несколько вариантов, но в основном у меня проблема с тем, что мой HTML-стол настолько велик. Я видел много людей, рекомендующих jQuery. Это имеет смысл для меня, учитывая размер моей таблицы? Если у вас есть подходящая опция Python, я бы очень понравился, поскольку в настоящее время я пишу большую часть своего кода на Python.
Ух ты, HTML таблицы с 500000 строк, человек, это огромное, я бы сказал, слишком огромный ... Почему не использовать пагинацию ? Кстати, откуда пришли первые данные? Я не думаю, что ты жестко закодировал свою таблицу, верно? –
Данные просканированы из Twitter. Я имею его в базе данных, но экспорт пока что был успешным только в HTML. Со всеми другими форматами инструмент базы данных отменил мои запросы на экспорт. – Tom