2016-09-06 7 views
1

Я хочу использовать awk для извлечения данных из этой таблицы, но я не могу получить правильный вывод. Каждая строка в таблице выглядит следующим образом:Извлечь данные из html с помощью awk

<tr> 
    <td class="center">4 
    </td> 
    <td>Bergkrystallen via Majorstuen 
    </td> 
    <td> 
    <img src='/Content/img/train2.png'/> 
    </td> 
    <td>18:55 
    </td> 
    <td class="center">1</td> 
</tr> 

Я хочу это: 4 Bergkrystallen через Majorstuen 18:55

Я попытался с помощью AWK, но я не могу получить это право:

file.html | awk -F "</?td.*>" '/<\/?td.*>.*/ {print $2 }' 

ответ

1

Try:

awk -F "</?td.*>" '/<\/?td.*>.*/ {printf "%s ",$2 } END {printf "\n"}' 

Примечание - вероятно, работает только, если ваш источник HTML соответствует ...


Dale

Смежные вопросы