2013-07-11 2 views
1

Я использовал функцию cummeRbund findSimilar(), чтобы найти 10 наиболее похожих генов для дифференциально экспрессированных генов, которые я идентифицировал с помощью Cuffdiff. Это использовало расстояние Дженсена-Шеннона и произвело список упорядоченных генов, который я сейчас хочу проверить на обогащение GO. Файл выглядит следующим образом:Анализ обогащения гена

"XLOC_007917" 0 
"XLOC_008881" 0.00417099861122699 
"XLOC_017692" 0.0178758082512721 
"XLOC_008901" 0.0180682577435933 
"XLOC_014267" 0.0333227735282459 
"XLOC_013408" 0.0400392521794019 
"XLOC_013497" 0.0412541820119971 
"XLOC_010554" 0.0453928603025379 
"XLOC_000570" 0.0461264880687295 
"XLOC_010786" 0.0469577467848723 

Я первый поиск вручную термины GO для каждого из подобных генов, но я хотел бы сделать более надежный анализ. Я пытаюсь запустить GSEA, приложение Java из Broad Institute.

Я сделал свой формат файла списка (* .rnk), и теперь мне нужно выбрать базу данных генных наборов.

Я работаю над губкой, поэтому я не могу использовать уже предоставленную базу данных.

Как создать собственную базу данных генных наборов? Как это будет выглядеть?

ответ

0

Моя стратегия отличается после вспомогательной сборки. Я извлекаю последовательности вновь обнаруженных генов, используя Cufflinks, нахожу CDS, BLAST и получаю условия GO. Другой вариант - использовать гены, которые у вас известны, и использовать gProfiler для анализа обогащения. Например, вы можете получить бесплатную пробную версию Blast2go для проведения анализов. Вы можете установить базы данных локально, и Blast будет быстрее. Вы можете провести анализ обогащения с помощью Blast2go. Вы также можете использовать установку экземпляра Galaxy и получить Blast2go из своего репозитория.

0

Чтобы заставить его работать с GSEA, вам необходимо иметь официальные символы человеческого гена в качестве идентификаторов генов в первом столбце вашего файла. Также неплохо убедиться, что каждый ген появляется только один раз в вашем ранжированном списке. Также обратите внимание, что в режиме ранжирования GSEA всегда сортирует ваш вход в порядке убывания.

Смежные вопросы