У меня есть большой список банков и уже вытащил дубликаты. У меня теперь есть проблема, что у меня есть один и тот же банк, но с разными именами для них (например, некоторые говорят «Wells Fargo Bank», а другой - «Wells Fargo Bank, NA»), поэтому первый раунд вывоза дубликатов не почини это. Как просто сгруппировать их вместе. Попытка потоковой линии, зная основную сумму, которую я обязан каждому из кредиторов.Excel - вытащите данные дублирования на основе первых двух слов
ответ
на основе первых двух слов
Следующая формула будет извлечь первую пару слов (т.е. до второго места слева) из строки A1:
=LEFT(A1,FIND(" ",A1,FIND(" ",A1)+1))
и может быть скопирован на заказ.
Это позиция для первого пространства, а затем используется для начала поиска следующего (второго) пространства. Обнаружив, что позиция LEFT принимает только символы до этой позиции.
Я думаю Data
>Text to Columns
будет легче https://www.youtube.com/watch?v=u1d1uk0wMts
Если вы хотите сгруппировать по первым 4-х символов, выберите Fixed Width
. В противном случае вы можете выбрать Delimited
и проверить запятую. Просто скопируйте данные в новый столбец.
Теперь вы можете группировать данные в сводной таблице или выбирать столбцы и Data
>Remove Duplicates
и проверять только столбец, где находятся значения ключа.
Из 150 лучших банков США около 50 не отличаются друг от друга только их первыми четырьмя персонажами. Только около десятка из 150 включают запятые даже в их «длинной форме». т. е. ни один подход не кажется почти таким же надежным, как запрошенный OP (т.е. * первая пара слов *). – pnuts
- 1. Найдите значение в диапазоне на основе первых двух слов и вернуть найденное значение в Excel
- 2. Фильтр символов на основе первых двух элементов
- 3. Количество файлов на основе первых двух букв
- 4. Слияние двух массивов на основе первых двух значений
- 5. Как заменить слова после первых двух слов
- 6. Разделитель Hadoop для первых двух слов ключа
- 7. частота слов на основе двух слов с использованием питона
- 8. Excel VBA: Войдите на сайт, вытащите данные из таблицы
- 9. VBA: Вытащите конкретные данные строки
- 10. MySQL - Исключение строк из Select на основе дублирования двух столбцов
- 11. regex - заменить слово на основе первых двух символов - R
- 12. Список заказов на основе первых двух чисел в строке - .net
- 13. Объединение двух таблиц на основе первых записей таблицы
- 14. Найдите отличительные IP-адреса на основе первых двух октетов?
- 15. Удаление всей строки на основе первых двух значений ячейки в Excel
- 16. Excel - возвращаемое значение на основе двух входов
- 17. Excel слияние двух файлов на основе переменной
- 18. Извлечение первых двух слов в perl с использованием regex
- 19. Excel Извлечения степени п первых слов из строки
- 20. Данные подмножества/извлечение данных на основе первых 7 букв
- 21. Печать первых N слов файла
- 22. выходные данные на основе двух таблиц
- 23. Как получить данные на основе двух условий?
- 24. Извлечь данные строки на основе двух столбцов
- 25. Excel VLookup на основе двух переменных на трех листах
- 26. Excel, добавляющий данные на основе текущих данных
- 27. скрывать строки в excel на основе слов в ячейке
- 28. Предотвращение дублирования двух SKSpriteNodes
- 29. Поиск комбинации в Excel на основе двух значений
- 30. Формула, которая удаляет значения на основе 3 первых символов?
Я использовал формулу «= INDEX ($ A $ 2: $ A $ 3000, MATCH (0, INDEX (COUNTIF ($ B $ 1: B1, $ A $ 2: $ A $ 3000), 0,0), 0)) «вытащить первый набор дубликатов – Excel
Вам нужно показать несколько примеров и определить некоторые правила, которые определяют, что такое« дубликат ». «Нечеткое соответствие» - не простая задача и требует немного большего объяснения с вашей стороны. –
Спасибо за ответ @TimWilliams, некоторые примеры того, что я считаю дубликатом, это то, что некоторые из них представлены «BOKF, NA dba Bank of Oklahoma», а другие - «BOKF, NA dba Bank of Texas». Я бы спустил их до BOKF. Другой пример - некоторые из них вводятся как «PNC Bank, N.A», а другие - «PNC Bank, Национальная ассоциация», и я бы хотел, чтобы они были классифицированы как «PNC Bank». Что общего с моей проблемой, так это то, что первые левые буквы того, что я пытаюсь совместить, являются общими. – Excel