Это очень интересный вопрос, и я ищу помощь экспертов, чтобы больше узнать об этом и как это сделать. У меня есть DataFrame (который я сделал при анализе данных из Big Iron ... все еще существует). Теперь я хочу удалить некоторые строки, используя регулярное выражение, но не знаю, как это работает в Pandas.Регулярное выражение для удаления строк
24 | DRFT.146.856 | Dollar- | (60.00) | DEBITS- | 0.00 | CREDITSDRA- | 0.00
25 | 0616-21.01 | 2407 | WAYZAT | TMCD | JUNE | 16,DRA |2013
26 | AND | CORRECTION |JOURNAL00 | <DB> |KLRETY | CATEGORYDRA- | *
27 | DRFT.146.867 | Dollar- | (200.00) | DEBITS- | 0.00 | CREDITSDRA- | 0.00
28 | DRFT.146.922 | Dollar- | (25.00) |DEBITS- | 0.00 | CREDITSDRA- |0.00
29 | DRFT.146.963 | Dollar- | (100.00) | DEBITS- | 0.00 | CREDITSDRA- | 0.00
30 | DRFT.146.964 | Dollar- | (100.00) | DEBITS- | 0.00 | CREDITSDRA- | 0.00
Ряд озабоченности 25 & 26, где данные не следует какому-либо шаблону. Любая подсказка.
Вы только что хотите удалить id 25 & 26? или есть шаблон, почему вы хотите его удалить? – HamZa
Я бы предложил отфильтровать их перед тем, как поместить их в «DataFrame». Похоже, что в некоторых столбцах должно быть легко проверить шаблоны или ограниченный набор допустимых значений. Насколько вы понимаете эти данные - какое поле * вы думаете, что можете фильтровать наиболее эффективно? –
@HamZa Существует шаблон. И это проблема, так как я не знаю, где находится местоположение, и только шаблон – LonelySoul