У меня есть файл данных с колонкой более 40000. В заголовке имя каждого столбца начинается с C1, c2, ..., cn, и каждый набор c имеет одно или несколько подмножеств, например c1. имеет 2 подмножества. Мне нужно удалить первый столбец (подмножество) каждого набора c. например, если вход выглядит следующим образом:Как удалить первое подмножество каждого набора столбцов в файле данных?
вход:
c1.20022 c1.31012 c2.44444 c2.87634 c2.22233 c3.00444 c3.44444
1 1 0 1 0 0 0 1
2 0 1 0 0 1 0 1
3 0 1 0 0 1 1 0
4 1 0 1 0 0 1 0
5 1 0 1 0 0 1 0
6 1 0 1 0 0 1 0
Мне нужен выход быть как:
c1.31012 c2.87634 c2.22233 c3.44444
1 0 0 0 1
2 1 0 1 1
3 1 0 1 0
4 0 0 0 0
5 0 0 0 0
6 0 0 0 0
7 1 0 0 0
Любые предложения, пожалуйста?
update: Если между цифрами в строке (которая является реальной ситуацией моего набора данных) не существует пробела, то что мне делать? мои средний, что мои реальные данные выглядят следующим образом: входа:
c1.20022 c1.31012 c2.44444 c2.87634 c2.22233 c3.00444 c3.44444
1 1010001
2 0100101
3 0100110
4 1010010
5 1010010
6 1010010
и выход:
c1.31012 c2.87634 c2.22233 c3.44444
1 0001
2 1011
3 1010
4 0000
5 0000
6 0000
7 1000
петли через первый ряд, записать номер столбца для первого заголовка каждого подмножества в списке (или в качестве ключа в хэш). Затем пропустите все строки и пропустите все столбцы и пропустите любой столбец, который находится в списке. – Barmar