У меня есть файл CSV, который имеет два столбца и 4500 строк. В одной колонке у меня есть несколько фраз, которые окружены кавычками. Мне нужно удалить весь текст, который предшествует и после кавычек.Удалить все символы до и после кавычек
Например:
How would you say "Hello, my Friend" when speaking outside?
should become "Hello, my Friend"
У меня также есть несколько строк, которые имеют слово NULL во втором столбце. Мне нужно, чтобы эти строки были удалены полностью.
Каков наилучший способ сделать что-то подобное? Я смотрю на регулярные выражения, но я не уверен, что они достаточно гибкие, чтобы делать то, что я хочу сделать, или как вы будете использовать их в CSV-файле (мне нужно, чтобы структура таблицы оставалась).
EDIT: 1) На данный момент я просто использую номера Apple, но я знаю, что этого не сделают, поэтому я рад любым предложениям. Он должен поддерживать персонажей кандзи.
2) Я удалил все строки NULL, так что больше не нужно (я просто добавил столбец чисел, отсортировал таблицу так, чтобы все NULL были вместе, удалены и отсортированы обратно столбцом чисел).
Это простой синтаксический анализ строк для большинства языков. Какие инструменты вы собираетесь использовать? Вы можете найти Excel удобным. – shawnt00
@ shawnt00. На данный момент я просто использую Apple Numbers, но я знаю, что этого не сделают, поэтому я рад любым предложениям. Он должен поддерживать персонажей кандзи. –