Я пытаюсь пропустить столбец в фрейме данных и создать новый столбец, используя подстроки из зацикленного столбца, если он содержит значение в словаре. Более конкретно, если отдельная строка в столбце адресов содержит состояние в словаре имен состояний и сокращений, добавьте аббревиатуру состояния в список, который станет новым столбцом.Цитирование через dataframe для извлечения подстрок, соответствующих словарю
Ниже код работает для полных матчей, но не сканирует строки подстроки:
import pandas as pd
df = pd.DataFrame((['Austin, Texas',
'Texas',
'Seattle, Washington',
',,, Texas',
'Olympia, WA']), columns = ['Place'])
states = {'Texas': 'TX',
'Washington': 'WA'}
place = df['Place']
results = []
for x in place:
if x in states:
results.append(x)
else:
results.append(None)
df['State'] = results
df
Спасибо!
Это делает трюк, большое спасибо! – MuirSalt
Я забыл спросить, как бы вы вернули не-список с этим? Я не думаю, что у меня есть Нью-Йорк, Нью-Йорк, по моим данным, поэтому для меня это не проблема. – MuirSalt
Извините, что являюсь вредителем, но я получаю ошибку «имя» ячейки «не определено»? Быстрый поиск Google, похоже, ничего не подтягивал? – MuirSalt