Я не часто использую XML, но мне нужно настроить некоторые данные. Я разместил строку ниже из блокнота ++. Мне нужно удалить целые строки, где LoanID - это дубликат. Файлы содержат около 200 000 строк, где 200 LoanID дублируются.Удалить строки в XML, где определенный столбец содержит дубликаты
Поскольку вся строка не обязательно должна быть дубликатом, но только 1 «столбец», я не могу использовать плагин TextFX. Например, BorrowerID может содержать дубликаты. Только LoanID не допускается содержать дубликаты.
линия 1:
<ns1:Loan>ns1:Identifiers:LoanID>876298<LoanID> <ns1:IsRegulatedLoan>ND,6</ns1:IsRegulatedLoan><ns1:Originator>TestBank</ns1:Originator><ns1:ServicerID>Testbank NV</ns1:ServicerID><ns1:BorrowerID>26547</ns1:BorrowerID><ns1:PropertyID>364239</ns1:PropertyID>
line2:
ns1:Loan ns1:Identifiers>:LoanID>819305:LoanID>
ns1:IsRegulatedLoan>ND,6/:IsRegulatedLoanns1:Originator>TestBank/ns1:Originator>ns1:ServicerID>Testbank NV</ns1:ServicerID>ns1:BorrowerID>195797:BorrowerID>
Недопустимый код XML, например. в строке 2 отсутствует <Также обратите внимание, что xml-элементы cam будут распределены по нескольким строкам (на самом деле фират, который я сделал бы на просмотр, будет переформатировать, чтобы он был читабельным) – Mark