Если вы хотите сделать что-то родовое для управления структурами данных проще всего можно сделать, это использовать питон библиотека чтобы облегчить работу.
Вы можете использовать библиотеку анализа данных Pandas Lib: Python для быстрого анализа файла на DataFrame, который предоставляет методы для создания того, что вы хотите.
Вам также нужно Numpy lib, потому что метод as_matrix (ниже) возвращает numpyArray.
Файл данных вы можете видеть как файл csv (Comma separated value) с пробелами в качестве разделителей.
палладием можно легко разобрать файл с read_csv:
import pandas as pd
import numpy as np
dataFrame = pd.read_csv("file.txt", sep = ' ')
Для выбора столбцов используется метод as_matrix:
selection = dataFrame.as_matrix((A,C,D))
Тогда вы, вероятно, хотите можете бросить его обратно dataFrame продолжить используя его методы:
newDataFrame = pd.DataFrame(selection)
Удаление «cdef» значений «abcdef» в столбце D выглядит как вещь, которая может быть решена простым для и с использованием методов [String] [5], предоставляемых Python. Это очень специфическая инструкция, и я не знаю какого-либо внедренного метода любой библиотеки, которая это выполняет.
Надеюсь, я помог вам.
PD: Я попытался опубликовать много ссылок, но система не позволяла мне. Я рекомендую вам искать Numpy и Pandas в Google, если у вас их нет. Вы должны проверить документы pandas DataFrame, чтобы проверить методы. Я в том случае, когда вы не понимали, что я искал pandas.read_csv, pandas.dataFrame.as_matrix docs в Google.
И если вы не знаете, как управлять строками, посмотрите в документах Python для String.
Редактировать: Во всяком случае, если вы не хотите использовать библиотеки libs, вы можете разделить файл txt на список списков, имитирующих матрицу, или используя структуру csv, которая упоминается в его ответе. Затем создайте функцию для удаления столбцов, проверяя первый элемент каждого столбца (Идентификатор столбца) и с некоторыми для экспорта в другую матрицу.
Затем создайте еще одну функцию, которая удаляет требуемые значения столбца, с некоторыми другими для s.
Дело в том, что использование функций для достижения того, что вы хотите, делает решение универсальным для любой таблицы, управляемой как матрица.
Если это не текстовый файл, какой файла? – wim
Я думаю, что OP говорит о расширении, а не о формате. –