2016-09-04 5 views
2

У меня есть список фильмов в файле CSV, 100rows х 1column, что выглядит следующим образом:Выбор данных в круглых скобках

1. Mulholland Drive (David Lynch, 2001) 

Я пытаюсь избавиться от числа в передней части, положить титул , директор и год в каждой колонке. Я сделал:

rank = pd.read_csv("/Users/...csv", header = 0) 
rank.columns = ['1'] 
rank['1'] = rank['1'].str[3:] 

, чтобы избавиться от всех чисел в передней, так дальше, я хотел, чтобы отделить то, что в скобках по:

rank = rank[rank.find("(")+1:rank.find(")")] 

, но я получаю:

AttributeError: 'DataFrame' object has no attribute 'find' 
+0

удалось обновить весь код? – Jordon

+0

Можете ли вы показать пример ожидаемого регистра, который поможет нам найти решение? – apast

+0

вы должны проверить метод захвата регулярных выражений ниже –

ответ

3

Если они всегда определенно в этом формате, например, - издеваясь над файлом только с данным примером (не так, если у вас есть скобки или запятые и т. Д. И т. Д.), Которые не соответствуют формату - это сломается):

rank = pd.read_csv('somefile.csv', header=None, names=['film']) 
df = rank.film.str.extract('(?:\d+\.\s+)(.*?)\((.*?),\s+(\d+)\)', expand=True) 

Which'll дать вам:

    0   1  2 
0 Mulholland Drive David Lynch 2001 
+0

Я бы сделал это на один шаг дальше и ввел имена столбцов в регулярное выражение. 'regex = r '(?: \ d + \. \ s +) (? P . *?) \ ((? P <Director>. *?), \ s + (? P <Year> \ d +) \)'' Тогда ' rank.film.str.extract (regex, expand = True) ' – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/2336654/">piRSquared</a></span> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">@piRSquared nice idea :) – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">Ты мой герой. – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/6792092/">matt</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4319274062" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">Смежные вопросы</div> <ul class="relative_list"> <li> 1. <a href="http://ru.voidcc.com/question/p-pkpqgogs-bqu.html" target="_blank" title="Строка в круглых скобках"> Строка в круглых скобках </a> </li> <li> 2. <a href="http://ru.voidcc.com/question/p-yxpsxpne-pe.html" target="_blank" title="Нужно удалить числа в круглых скобках и круглых скобках"> Нужно удалить числа в круглых скобках и круглых скобках </a> </li> <li> 3. <a href="http://ru.voidcc.com/question/p-ehxplzmo-no.html" target="_blank" title="Об использовании круглых скобках"> Об использовании круглых скобках </a> </li> <li> 4. <a href="http://ru.voidcc.com/question/p-ywrqfvou-ya.html" target="_blank" title="Получить строку в круглых скобках"> Получить строку в круглых скобках </a> </li> <li> 5. <a href="http://ru.voidcc.com/question/p-vadxcbgd-bbr.html" target="_blank" title="Элемент массива в круглых скобках"> Элемент массива в круглых скобках </a> </li> <li> 6. <a href="http://ru.voidcc.com/question/p-wwarlwyg-bam.html" target="_blank" title="Объявление переменных в круглых скобках"> Объявление переменных в круглых скобках </a> </li> <li> 7. <a href="http://ru.voidcc.com/question/p-mbzppogp-brw.html" target="_blank" title="Определение переменных в круглых скобках"> Определение переменных в круглых скобках </a> </li> <li> 8. <a href="http://ru.voidcc.com/question/p-xltaasgt-bnb.html" target="_blank" title="Замена символов в круглых скобках"> Замена символов в круглых скобках </a> </li> <li> 9. <a href="http://ru.voidcc.com/question/p-blxvkelk-tq.html" target="_blank" title="Захват элементов в круглых скобках"> Захват элементов в круглых скобках </a> </li> <li> 10. <a href="http://ru.voidcc.com/question/p-cyovfreh-qq.html" target="_blank" title="Заменить строку в круглых скобках"> Заменить строку в круглых скобках </a> </li> <li> 11. <a href="http://ru.voidcc.com/question/p-akuremfe-ta.html" target="_blank" title="Указатель C++ в круглых скобках"> Указатель C++ в круглых скобках </a> </li> <li> 12. <a href="http://ru.voidcc.com/question/p-fhaklofv-bbk.html" target="_blank" title="Строки Javascript в круглых скобках"> Строки Javascript в круглых скобках </a> </li> <li> 13. <a href="http://ru.voidcc.com/question/p-plmyjdyj-bnu.html" target="_blank" title="Извлечь текст в круглых скобках в R"> Извлечь текст в круглых скобках в R </a> </li> <li> 14. <a href="http://ru.voidcc.com/question/p-cfixirod-qr.html" target="_blank" title="Regex для круглых скобках (JavaScript)"> Regex для круглых скобках (JavaScript) </a> </li> <li> 15. <a href="http://ru.voidcc.com/question/p-ajwmhlys-xp.html" target="_blank" title="Удаление текста в круглых скобках (круглые скобки в круглых скобках prob)"> Удаление текста в круглых скобках (круглые скобки в круглых скобках prob) </a> </li> <li> 16. <a href="http://ru.voidcc.com/question/p-gzngeiuv-bdv.html" target="_blank" title="Split Числа в круглых скобках в Java"> Split Числа в круглых скобках в Java </a> </li> <li> 17. <a href="http://ru.voidcc.com/question/p-kjtgjnez-sx.html" target="_blank" title="Regexp для извлечения данных в круглых скобках и запятые"> Regexp для извлечения данных в круглых скобках и запятые </a> </li> <li> 18. <a href="http://ru.voidcc.com/question/p-tspsoaps-t.html" target="_blank" title="Что означает звездочка в пустых круглых скобках?"> Что означает звездочка в пустых круглых скобках? </a> </li> <li> 19. <a href="http://ru.voidcc.com/question/p-qwirjddi-yt.html" target="_blank" title="Соответствует любому регулярному выражению в круглых скобках"> Соответствует любому регулярному выражению в круглых скобках </a> </li> <li> 20. <a href="http://ru.voidcc.com/question/p-zblgoyfp-uq.html" target="_blank" title="Соотношение Javascript в круглых скобках внутри строки"> Соотношение Javascript в круглых скобках внутри строки </a> </li> <li> 21. <a href="http://ru.voidcc.com/question/p-ujroikdq-bat.html" target="_blank" title="Python: Как удалить текст в круглых скобках?"> Python: Как удалить текст в круглых скобках? </a> </li> <li> 22. <a href="http://ru.voidcc.com/question/p-upbepyzh-xe.html" target="_blank" title="Чтение текста только в круглых скобках C#"> Чтение текста только в круглых скобках C# </a> </li> <li> 23. <a href="http://ru.voidcc.com/question/p-gxfntkpn-bcd.html" target="_blank" title="Что означает утверждение в круглых скобках"> Что означает утверждение в круглых скобках </a> </li> <li> 24. <a href="http://ru.voidcc.com/question/p-pglzkkqq-bgx.html" target="_blank" title="Извлечь строку в круглых скобках - PYTHON"> Извлечь строку в круглых скобках - PYTHON </a> </li> <li> 25. <a href="http://ru.voidcc.com/question/p-fyqfcndu-bhb.html" target="_blank" title="Извлечь текст не включены в круглых скобках"> Извлечь текст не включены в круглых скобках </a> </li> <li> 26. <a href="http://ru.voidcc.com/question/p-ardkorgy-hv.html" target="_blank" title="регулярное выражение матч в круглых скобках"> регулярное выражение матч в круглых скобках </a> </li> <li> 27. <a href="http://ru.voidcc.com/question/p-oxiyimdf-bkm.html" target="_blank" title="Символ совпадения не в вложенных круглых скобках"> Символ совпадения не в вложенных круглых скобках </a> </li> <li> 28. <a href="http://ru.voidcc.com/question/p-gxxfwmzu-bnu.html" target="_blank" title="Значения Excel в круглых скобках становятся отрицательными"> Значения Excel в круглых скобках становятся отрицательными </a> </li> <li> 29. <a href="http://ru.voidcc.com/question/p-eejuphxf-bot.html" target="_blank" title="RegExp: Получить текст в круглых скобках"> RegExp: Получить текст в круглых скобках </a> </li> <li> 30. <a href="http://ru.voidcc.com/question/p-fprdpkuq-gx.html" target="_blank" title="Индекс массива C в круглых скобках"> Индекс массива C в круглых скобках </a> </li> </ul> </div> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3534119089"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img2.voidcc.com/voidso/script/side.js?t=1652515422009"></script> <script type="text/javascript" src="http://img2.voidcc.com/voidso/plugin/highlight/highlight.pack.js"></script> <link href="http://img2.voidcc.com/voidso/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <!-- VOIDCC问答侧边栏广告 --> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3862022848" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> Последний вопрос </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ru.voidcc.com/question/p-yzhvyode-baa.html" target="_blank" title="правила изображения всегда возвращает ошибку в Laravel"> правила изображения всегда возвращает ошибку в Laravel </a> </li> <li class="side_article_list_item"> 2. <a href="http://ru.voidcc.com/question/p-qirnrsli-yu.html" target="_blank" title="onchange выпадающий список из базы данных - php, без java или ajax"> onchange выпадающий список из базы данных - php, без java или ajax </a> </li> <li class="side_article_list_item"> 3. <a href="http://ru.voidcc.com/question/p-xaqxqtti-wu.html" target="_blank" title="Serilog перезаписать файл"> Serilog перезаписать файл </a> </li> <li class="side_article_list_item"> 4. <a href="http://ru.voidcc.com/question/p-oehzajdj-qx.html" target="_blank" title="Java 1.8.121 не работает на linux - NoClassDefFoundError"> Java 1.8.121 не работает на linux - NoClassDefFoundError </a> </li> <li class="side_article_list_item"> 5. <a href="http://ru.voidcc.com/question/p-swomaaxu-pg.html" target="_blank" title="Apache Zeppelin (Shiro Security) не может сохранять разрешения на запись"> Apache Zeppelin (Shiro Security) не может сохранять разрешения на запись </a> </li> <li class="side_article_list_item"> 6. <a href="http://ru.voidcc.com/question/p-pszgqdzk-py.html" target="_blank" title="Определен ли режим по умолчанию для реализации потока?"> Определен ли режим по умолчанию для реализации потока? </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> Смежные вопросы</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ru.voidcc.com/question/p-pkpqgogs-bqu.html" target="_blank" title="Строка в круглых скобках"> Строка в круглых скобках </a> </li> <li class="side_article_list_item"> 2. <a href="http://ru.voidcc.com/question/p-yxpsxpne-pe.html" target="_blank" title="Нужно удалить числа в круглых скобках и круглых скобках"> Нужно удалить числа в круглых скобках и круглых скобках </a> </li> <li class="side_article_list_item"> 3. <a href="http://ru.voidcc.com/question/p-ehxplzmo-no.html" target="_blank" title="Об использовании круглых скобках"> Об использовании круглых скобках </a> </li> <li class="side_article_list_item"> 4. <a href="http://ru.voidcc.com/question/p-ywrqfvou-ya.html" target="_blank" title="Получить строку в круглых скобках"> Получить строку в круглых скобках </a> </li> <li class="side_article_list_item"> 5. <a href="http://ru.voidcc.com/question/p-vadxcbgd-bbr.html" target="_blank" title="Элемент массива в круглых скобках"> Элемент массива в круглых скобках </a> </li> <li class="side_article_list_item"> 6. <a href="http://ru.voidcc.com/question/p-wwarlwyg-bam.html" target="_blank" title="Объявление переменных в круглых скобках"> Объявление переменных в круглых скобках </a> </li> <li class="side_article_list_item"> 7. <a href="http://ru.voidcc.com/question/p-mbzppogp-brw.html" target="_blank" title="Определение переменных в круглых скобках"> Определение переменных в круглых скобках </a> </li> <li class="side_article_list_item"> 8. <a href="http://ru.voidcc.com/question/p-xltaasgt-bnb.html" target="_blank" title="Замена символов в круглых скобках"> Замена символов в круглых скобках </a> </li> <li class="side_article_list_item"> 9. <a href="http://ru.voidcc.com/question/p-blxvkelk-tq.html" target="_blank" title="Захват элементов в круглых скобках"> Захват элементов в круглых скобках </a> </li> <li class="side_article_list_item"> 10. <a href="http://ru.voidcc.com/question/p-cyovfreh-qq.html" target="_blank" title="Заменить строку в круглых скобках"> Заменить строку в круглых скобках </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div><!-- wrap end--> <!-- footer --> <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://ru.voidcc.com/contact">Свяжитесь с нами</a></li> <li>© 2020 RU.VOIDCC.COM</li> <li><a rel="nofollow" href="https://beian.miit.gov.cn/" target="_blank">沪ICP备13005482号-13</a></li> <li><script type="text/javascript" src="https://s9.cnzz.com/z_stat.php?id=1280098168&web_id=1280098168"></script></li> <li><a href="http://cn.voidcc.com/" target="_blank" title="程序问答园区">简体中文</a></li> <li><a href="http://hk.voidcc.com/" target="_blank" title="程序問答園區">繁體中文</a></li> <li><a href="http://ru.voidcc.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.voidcc.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.voidcc.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.voidcc.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.voidcc.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.voidcc.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.voidcc.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.voidcc.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.voidcc.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.voidcc.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.voidcc.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer> <!-- / footer --> <script async src="https://www.googletagmanager.com/gtag/js?id=UA-77509369-5"></script> <script> window.dataLayer = window.dataLayer || []; function gtag() { dataLayer.push(arguments); } gtag('js', new Date()); gtag('config', 'UA-77509369-5'); </script> <script> var _hmt = _hmt || []; (function () { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?67d4731349f0b00136755b80364ce381"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>