У меня есть данные взаимодействия белка с белком homo sapiens. Размер матрицы равен < 4850628x3>. Первые две колонки - это белки, а третья - ее уверенный результат. Проблема состоит в половину строки повторяющиеся парыMatlab: Удаление повторяющихся взаимодействий
, если белок А взаимодействует с В, С, D. он упоминается как
- AB 0.8
- переменного тока 0,5
- AD 0.6
- Б.А. 0.8
- СА 0,5
- Д.А. 0,6
Если вы будете наблюдать уверенную партитуру взаимодействующего с B и B, взаимодействующей с А 0,8
Если у меня есть матрица < 4850628x3> половина строки повторяющиеся пары. Если я выберу Unique (1, :), я могу потерять некоторые данные.
Но я хочу < 2425314x3> i.e без дубликатов пар. Как я могу сделать это эффективно?
Благодаря Naresh
Если вы сортируете по столбцу 1, не можете ли вы просто сбросить вторую половину строк? Это предполагает, что всегда будут пары – Dan
@ Dan Я предполагаю, что где-то вниз по линии, протеин C будет взаимодействовать с D. Если вы удалите нижнюю половину строк, строка 'CD ...' будет удалена вместе с 'DC. ..'. Вам нужно принудительно выполнить некоторый порядок на белках и удалить строки, в которых 'col 1> col2'. – beaker