У нас есть файл Excel с листом, содержащий записи людей.Excel Regex или экспорт в Python? ; «Vlookup» в Python?
1. Номер телефона санитария
Одно из полей является полем номер телефона, который содержит номера телефонов в формате, например:
+XX(Y)ZZZZ-ZZZZ
(где X, Y и Z являются целыми числами).
Есть также некоторые записи, которые имеют меньше цифр, например:
+XX(Y)ZZZ-ZZZZ
И другие с действительно зажмурил форматы:
+XX(Y)ZZZZ-ZZZZ/ZZZZ
или:
ZZZZZZZZ
Мы должны дезактивировать все эти данные в формате:
0YZZZZZZZZ (or OYZZZZZZ with those with less digits).
2. Залейте супервизора Детали
Каждый человек имеет супервизора, учитывая как числовой идентификатор. Нам нужно выполнить поиск, чтобы получить имя и адрес электронной почты этого супервизора и добавить его в строку.
Этот поиск будет в первую очередь на том же листе (то есть поиск самого себя), и он может затем Откат к другой книге с большим количеством людей.
3. Подход?
Для первой проблемы я решил каким-то образом использовать регулярное выражение в Excel/VBA, чтобы выполнить синтаксический анализ. Мой Excel-fu не самый лучший, но я полагаю, что могу научиться ... lol. Какие-то конкретные точки на этом?
Однако, я был бы лучше экспортировать XLS в CSV (например, с использованием xlrd), затем с помощью Python, чтобы исправить телефонные номера?
Для второго подхода я думал просто использовать vlookups в Excel, вытащить данные и, как-то, провалиться, сначала на поиск себя, затем на внешнюю книгу, а затем просто вставить текст ошибки , Не знаете, как сделать эту последнюю часть.
Однако, если я случаться выбрать для экспорта в CSV и сделать это в Python, что эффективный способ сделать ВПР? (Должен ли я конвертировать в Словаре, или просто перебирать? Или есть лучше, или более идиоматических способ?)
Приветствия, Victor
Ваше проблемное пространство довольно велико, лучше спросить несколько вопросов с более прямыми вопросами, чтобы мы могли вам помочь. Многие из этих решений могут быть сделаны по вашим предпочтениям. – dlamotte
@xyld: Хмм, я должен удалить этот вопрос и разделить его на два вопроса? Это как раз тот подход, который я выбираю (Python против Excel/VBA), в идеале он сможет обрабатывать оба. Спасибо, Виктор – victorhooi
Не навреди, если оставить его открытым, но, возможно, отредактируйте конкретные вопросы, которые у вас есть о конкретном подходе. – dlamotte