У меня есть C# регулярное выражение для имен авторов в текстовом документе, который записывается в виде:Использование Regex для извлечения части строки из HTML/текстового файла
"author":"AUTHOR'S NAME"
Регулярное выражение выглядит следующим образом:
new Regex("\"author\":\"[A-Za-z0-9]*\\s?[A-Za-z0-9]*")
Это возвращает "author":"AUTHOR'S NAME
. Тем не менее, я не хочу показывать кавычки или слово Author
. Я просто хочу имя.
Может ли кто-нибудь помочь мне получить ожидаемое значение, пожалуйста?
Можете ли вы разместить содержание автора, как оно отображается в текстовом документе? – DGibbs
Несвязанный, но ваше выражение соответствует только подмножеству имен. Он не допускает каких-либо специальных символов, таких как '' 'в' O'Connor', и он допускает только одно пространство, не дефисы, никакие иностранные символы и т. Д. Я не знаю вашего usecase, но если вы знайте, что имя автора будет заключено в кавычки, вам нужно будет просто принять что-либо, что не является двойной кавычкой: '\" author \ ": \" ([^ \ "] +) \" '. –
Спасибо, Дэвид. Хороший момент, который я не рассматривал. Гиббс, имя автора появится после текста, который мне удалось найти в кавычках, как показано выше. –