после синтаксического анализа большого PDF-документ я в конечном итоге со строкой в формате в Python:строка панд dataframe
Company Name;(Code) at End of Month;Reason for Alteration No. of Shares;Bond Symbol, etc.; Value, etc.; after Alteration;Remarks
Shares;Shares
TANSEISHA CO.,LTD.;(9743)48,424,071;0
MEITEC CORPORATION;(9744)31,300,000;0
TKC Corporation;(9746)26,731,033;0
ASATSU-DK INC.;(9747);42,155,400;Exercise of Subscription Warrants;0;May 2013 Resolution based 1;0Shares
May 2013 Resolution based 2;0Shares
было бы возможно превратить это в панд dataframe следующим образом, где столбцы ограниченный «;». Таким образом, глядя на предыдущем разделе из строки мой ДФ должен выглядеть следующим образом:
Company Name (Code) at End of Month Reason for Alteration ....
Value,etc after Alteration Remarks Shares .....
Как дополнительная проблема мои строки не всегда имеют одинаковое число строк, разделенных «;», что означает, что я должен был бы найти способ увидеть мои столбцы (я не возражаю против установки как dataframe с 15 столбцами и последующего удаления тех, которые мне не нужны) Спасибо
Я голосую нет! Я не могу разобрать, какая логика выводит нас из текста в предоставленный вами файл данных. – piRSquared