Я боролся с управлением некоторыми данными. У меня есть данные, которые я превращались в список списков каждый базовый подсписок имеет структуру, подобную следующейЧтение и группировка списка данных в Python
<1x>begins
<2x>value-1
<3x>value-2
<4x>value-3
some indeterminate number of other values
<1y>next observation begins
<2y>value-1
<3y>value-2
<4y>value-3
some indeterminate number of other values
это продолжается в течение неопределенного количества времени в каждом подсписка
EDIT Мне нужно, чтобы получить все вхождений < 2, < 4 отделялись и сгруппированы вместе я создаю новый список списков [[< 2x> значение-1, < 3x> ценностно-2, < 4x> ценностно-3], [< 2y > значение-1, < 3y> значение-2, < 4y> значение-3]]
EDIT все строки, которые следуют < 4x> и < 4y> (и в этом отношении < 4anyalpha> имеют одинаковый тип кодирования, и я не знаю априори, насколько высоки числа, эти как теги sgml, которые не закрыты, я использовал числа, потому что мои пальцы болели от всего кодирования, которое я делал сегодня.
Решение, которое я придумал, наконец, не очень красиво
listINeed=[]
for sublist in biglist:
for line in sublist:
if '<2' in line:
var2=line
if '<3' in line:
var3=line
if '<4' in line:
var4=line
templist=[]
templist.append(var2)
templist.append(var3)
templist.append(var4)
listIneed.append(templist)
templist=[]
var4=var2=var3=''
Я смотрел на способы, чтобы попытаться очистить это, но не увенчались успехом. Это прекрасно работает, я просто видел это как еще одну возможность узнать больше о python, потому что я думаю, что это должно обрабатываться одной строкой.
Это помогло бы, если бы вы могли отредактировать свой вопрос, чтобы дать лучшее описание того, что вы хотите - это действительно не ясно, как вы его сейчас. –
Если это список списков, почему вы показываете это в обозначении «<1x> бла»? Почему бы не показать это как реальные списки списков? [[1, x, blah], [2, x, value-1], ...] Что у вас ДЕЙСТВИТЕЛЬНО? Список строк? Почему так? –
Потому что так поступает исходный файл.Я прочитал в исходном файле, и в начале каждой строки есть теги, которые я должен использовать, чтобы определить, что обрабатывать. Каждый исходный файл является подсписком. Нотация состоит в том, что каждая строка начинается с тэга SGML – PyNEwbie