Поиск шаблона ISBN с помощью regexp в Notepad ++

-1

У меня есть множество текстовых файлов, в которых есть данные книги, в которых я пытаюсь извлечь Международный стандартный номер книги (ISBN). Пример сниппеты:Поиск шаблона ISBN с помощью regexp в Notepad ++

{" , "classifications": {}, "title": "La casa", "identifiers": {}, "isbn_13": ["978-84-940533-7-5"], "covers": [7281722], "created": {"type": "/type/datetime",

"2014-07-28T06:07:52.898549"}, "number_of_pages": 408, "isbn_13": ["9789602354292"],

, но как бы я идти о поиске и извлечении этой информации ISBN? Некоторые номера ISBN имеют тире, а некоторые нет. Есть ли способ заменить все в текстовом файле пустым, за исключением соответствующих фрагментов? Я провел исследование по нескольким подобным вопросам, но с трудом понимаю все это, так как я очень новичок в Notepad ++.

источник

2016-09-12 TruthJustin

См. Ссылку http://markantoniou.blogspot.com.es/2008/06/notepad-how-to-use-regular-expressions.html – esmoreno

Допустим, у вас есть ISBN и еще какой-нибудь текст в текстовом файле построчно вы пройти следующие шаги:

Сделайте копию текстового файла первым!

Открыть текстовый файл в Блокноте ++.
Ctrl + H
Режим поиска: Регулярное выражение
Найти: ^.*?(((1[03])*[ ]*(:){0,1})*(([0-9Xx][- ]*){13}|([0-9Xx][- ]*){10})).*
Заменить: \ 1
Нажмите на Заменить все

Для RegEx сначала выполните поиск в Google или StackOverflow. Для получения дополнительной информации смотрите RegExLib.com, первую библиотеку регулярных выражений в Интернете.

источник

2016-09-12 18:12:16

Спасибо за ответ! Я сделал это, и, хотя он изолировал некоторые ISBN, он не изолировал всех и, казалось, полностью остановился после строки 10 000 или около того. Я попробовал пример ISBN в библиотеке RegEx, но у меня все еще есть проблемы. – TruthJustin

Ничего, думаю, я понял это. Благодаря!! Очень признателен. – TruthJustin

Поиск шаблона ISBN с помощью regexp в Notepad ++

ответ

Смежные вопросы