2016-09-12 2 views
-1

У меня есть множество текстовых файлов, в которых есть данные книги, в которых я пытаюсь извлечь Международный стандартный номер книги (ISBN). Пример сниппеты:Поиск шаблона ISBN с помощью regexp в Notepad ++

{" , "classifications": {}, "title": "La casa", "identifiers": {}, "isbn_13": ["978-84-940533-7-5"], "covers": [7281722], "created": {"type": "/type/datetime", 

и

"2014-07-28T06:07:52.898549"}, "number_of_pages": 408, "isbn_13": ["9789602354292"], 

, но как бы я идти о поиске и извлечении этой информации ISBN? Некоторые номера ISBN имеют тире, а некоторые нет. Есть ли способ заменить все в текстовом файле пустым, за исключением соответствующих фрагментов? Я провел исследование по нескольким подобным вопросам, но с трудом понимаю все это, так как я очень новичок в Notepad ++.

+0

См. Ссылку http://markantoniou.blogspot.com.es/2008/06/notepad-how-to-use-regular-expressions.html – esmoreno

ответ

1

Допустим, у вас есть ISBN и еще какой-нибудь текст в текстовом файле построчно вы пройти следующие шаги:

Сделайте копию текстового файла первым!

  • Открыть текстовый файл в Блокноте ++.
  • Ctrl + H
  • Режим поиска: Регулярное выражение
  • Найти: ^.*?(((1[03])*[ ]*(:){0,1})*(([0-9Xx][- ]*){13}|([0-9Xx][- ]*){10})).*
  • Заменить: \ 1
  • Нажмите на Заменить все

Для RegEx сначала выполните поиск в Google или StackOverflow. Для получения дополнительной информации смотрите RegExLib.com, первую библиотеку регулярных выражений в Интернете.

+0

Спасибо за ответ! Я сделал это, и, хотя он изолировал некоторые ISBN, он не изолировал всех и, казалось, полностью остановился после строки 10 000 или около того. Я попробовал пример ISBN в библиотеке RegEx, но у меня все еще есть проблемы. – TruthJustin

+0

Ничего, думаю, я понял это. Благодаря!! Очень признателен. – TruthJustin

Смежные вопросы