Я использую SAX Parser. Я пытаюсь отправить «содержание» Я извлеченный с помощью ниже кода:Передача содержимого функции другого модуля в Python
После проверки StartElement и EndElement, у меня есть следующий код:
def characters(self, content):
text = format.formatter(content)
это format.formatter, как ожидается, читать эти данные, которые Я отправил «контент» для любой обработки, например, удаление ненужных символов и т. Д. И вернуть его. Я делаю это, используя функцию string.replace:
remArticles = {' ! ':'', ' $ ':''}
for line in content:
for i in remArticles:
line= line.replace(i, remArticles[i])
#FormattedFileForIndexing.write(line)
return line
Однако выход не подходит, как ожидалось.
Будет здорово, если кто-то может помочь в этом.
источника будет нечто вроде:
«! О, это много и 1000s из $$$$»
Ожидаемый: О, это много 1000s
Фактически remArticles = {'!': '', '$': ''} Был образцом. У меня много ключей в этом, и это довольно огромно. Я даю пример: remArticles = {'a': '', 'the': '', 'and': '', 'an': '', '& nbsp;': '', ' imageize ':' ',' image_seal ':' ',' image_caption ':' ',' svg | mapsize ':' ',']] ':' ',']] ':' ',' [[': '', '[[': '', 'ca': '', 'io': '', 'ht': '', 'ht': '', 'nl': '', 'pl' : '', 'pt': '', 'vo': '', '{': '', '[': '', '*': '', '|': '',} I внесенные изменения в соответствии с вашим предложением, оно работает в определенной степени. Смысл, некоторые алфавиты заменяются, но не}} или]] или | и т. д. – Rakanid
- то, что ваши полные remArticles? У вас также есть повторяющиеся ключи в вашем dict –
Я также проверил код против ']}' и т. Д.и он отлично работает, как я уже сказал, '!!' 'не равен' "!" ' –