Я начинаю с регулярным выражением и вам нужна ваша помощь в поиске правильного регулярного выражения для моего проекта в Notepad ++. Моя цель - найти регулярное выражение, чтобы найти &. Извлеките некоторые строки в одинарных кавычках, которые были извлечены из документа HTML. Мне нужно одно регулярное выражение, чтобы сделать все это, и я обязан использовать Notepad ++.Regex in Notepad ++ required
Вот структура моего текста документа (не может использовать оригинал, так как она содержит конфиденциальные материалы):
{ group: '1', code: '1111', ignored: true, shortDescription: 'This is a short "description", containing commas or quotes', description: '', document: 'documentname.txt', row: '1', original: 'this is the original text', translated: 'this is the translated text', matchRate: {label: "label", value: "value"} } _LF_
{ group: '2', code: '2222', ignored: true, shortDescription: 'This is another short "description", containing commas or quotes', description: '', document: 'documentname.txt', row: '1', original: 'this is the original text', translated: 'this is the translated text', matchRate: {label: "label", value: "value"} } _LF_
{ group: '3', code: '3333', ignored: true, shortDescription: 'This is yet another short "description", containing commas or quotes', description: '', document: 'documentname.txt', row: '1', original: 'this is the original text', translated: 'this is the translated text', matchRate: {label: "label", value: "value"} }
Мои документы содержит 33 строк, все выглядит как это («LF» в конце концов, разрыв строки). «группа», «код» и т. д. всегда одинаковы, строка в одинарных кавычках отличается и также может быть пустой.
Мне нужно, чтобы извлекал все значения в '' (или удалял все остальное), разделенные запятой (или аналогичной), чтобы помещать их в документ excel. Мне также нужны разрывы строк.
Вот , что я уже сделал: Я могу найти все строки в одинарных кавычках с
([^']*+'[^\r\n']*+)
хотя этим путем, также текст, который приходит после концовки одинарных кавычек до следующего начала одинарных кавычек отображается как выход.
Что мне еще нужно - это возможность стереть все остальные тексты, включая одинарные кавычки вокруг этих строк. Мне это не удалось. Вот то, что результат должен выглядеть следующим образом:
'1', '1111', 'This is a short "description", containing commas or quotes' '', 'documentname.txt', '1', 'this is the original text', 'this is the translated text'
'2', '2222', 'This is another short "description", containing commas or quotes' '', 'documentname.txt', '1', 'this is the original text', 'this is the translated text'
'3', '3333', 'This is yet another short "description", containing commas or quotes' '', 'documentname.txt', '1', 'this is the original text', 'this is the translated text'
Я также читал некоторые темы на регулярном выражении, как this или this, и я узнал много (как я уже говорил, начинающий говорить здесь ...), но я Жду» t найти решение для извлечения точно строк, которые мне нужны.
Я был бы очень рад, если бы кто-то мог мне помочь. Большое спасибо!
Try '[^ \ п«] *»([^\ n '] +)' [^ \ n '] * 'и заменить на' \ 1 \ t' –
. Есть две проблемы: 1) поиск требуемых предметов и (2) точный формат вывода, который вы хотите , Если вы показываете пример с двумя или тремя строками ввода плюс ожидаемый вывод с этого ввода, на ваш вопрос может быть дан ответ. – AdrianHHH
@ AdrianHHH Спасибо, я обновил свой вопрос соответственно. @Wiktor Stribiżew: Это не сделало трюк - но я думаю, что мой вопрос был слишком расплывчатым, надеюсь, теперь его яснее. – fraukeberlin