Каковы некоторые структуры данных, которые должны быть известны кому-то, участвующим в биоинформатике? Я предполагаю, что кто-то должен знать о списках, хэшах, сбалансированных деревьях и т. Д., Но я ожидаю, что существуют структуры данных, специфичные для домена. Есть ли какая-нибудь книга, посвященная этой теме?Структуры данных для биоинформатики
ответ
Наиболее фундаментальной структурой данных, используемой в биоинформатике, является строка. Существует также целый ряд различных структур данных, представляющих строки. А алгоритмы, такие как сопоставление строк, основаны на эффективных структурах представления/данных.
Всеобъемлющий работа на это Algorithms on Strings, Trees and Sequences
Много Дэн Gusfield о вводных книг по биоинформатике будут рассмотрены некоторые из основных структур, вы бы использовать. Я не уверен, что такое стандартный учебник, но я уверен, что вы можете это найти. Это может быть полезно посмотреть на некоторые из конкретных языков книг по:
Я выбрал те два в качестве примера, потому что они опубликованы O'Reilly, который, по моему опыту, публикует книги хорошего качества.
У меня просто есть книга Python на моем жестком диске, и многое из этого говорит о обработке строк для биоинформатики с использованием Python. Похоже, что биоинформатика использует любые необычные специальные структуры данных, только существующие.
Многие проекты в области биоинформатики предполагают объединение информации из разных полуструктурированных источников. RDF и онтологии необходимы для большей части этого. См., Например, проект bio2RDF. http://bio2rdf.org/. Хорошее понимание идентификаторов ценно.
Большая биоинформатика - это поисковые и быстрые легкие инструменты, которые часто используются. См. Инструменты рабочего процесса, такие как Taverna, где основным ресурсом часто является набор веб-сервисов, поэтому HTTP/REST являются общими.
Пространственные хеширующие структуры данных (kd-tree), например, часто используются для запросов ближайшего соседа для векторов любых признаков, а также для анализа структуры трехмерного белка.
Лучшая книга для вашего $$ - Understanding Bioinformatics by Zvelebil, потому что она охватывает все: от анализа последовательности до сравнения структуры.
В дополнение к основным знакомство со структурами, которые вы упомянули, suffix trees (и суффикс массивов), de Bruijn graphs и interval graphs широко используются. The Handbook of Computational Molecular Biology очень хорошо написано. Я никогда не читал все это, но я использовал его как ссылку.
Я также настоятельно рекомендую эту книгу, http://www.comp.nus.edu.sg/~ksung/algo_in_bioinfo/
И еще недавно, питон гораздо чаще используется в биоинформатике, чем Perl. Поэтому я действительно предлагаю вам начать с python, он широко используется в моих проектах.
Независимо от ваших математических или вычислительных знаний, вы, скорее всего, найдете приложение в вычислительной биологии.Если нет, сделайте еще один вопрос о stackoverflow, и вам помогут: o)
Как уже упоминалось в других ответах, несколько вневременных - это сравнение строк и обнаружение паттерна в одномерных данных, так как последовательности так легко получить. С новым интересом к медицинской информатике, хотя у вас также есть двух/трехмерный анализ изображения, который вы запускаете, например. против геномных данных. С молекулярной биохимией вы также имеете поиск образцов на трехмерных поверхностях и молекулярное моделирование. Чтобы изучить эффекты лекарств, вы будете работать с генными сетями и сравнить их с тканями. Типичные проблемы для большой интеграции данных и информации. И тогда вам понадобятся статистические описания вероятности шаблона или клинической ассоциации любых признаков, обнаруженных случайно.
- 1. Демоверсия Silverlight для биоинформатики
- 2. Лучшая ОС для биоинформатики?
- 3. Ресурсы биоинформатики
- 4. Как вы думаете, лучший язык для биоинформатики?
- 5. структуры данных для алгоритма *
- 6. Структуры данных для jinja
- 7. Лучший способ организовать проекты в области биоинформатики?
- 8. Структуры структуры данных RESTful
- 9. Лучшего Выравнивание Струнного B в подстроке - биоинформатики
- 10. Пул ресурсов для структуры данных
- 11. структуры данных для анализируемых предложений
- 12. Необходимые упражнения для структуры данных
- 13. Структуры данных для легкого просмотра
- 14. визуальное описание для структуры данных
- 15. Термин для структуры данных моделирования
- 16. Структуры данных для менеджера памяти
- 17. DataContract для различной структуры данных
- 18. Структуры данных, используемые для Redis
- 19. Визуализатор структуры данных для javascript
- 20. Структуры данных для иерархии организации
- 21. обещание для рекурсивной структуры данных
- 22. Предложение для структуры данных Matlab
- 23. Цикл структуры данных для всех наборов данных
- 24. Выбор структуры данных для очень больших данных
- 25. Структура базы данных для структуры данных дерева
- 26. Структуры данных для хранения множества типов данных
- 27. Эффективные структуры данных для сопоставления данных
- 28. Структуры данных
- 29. Firebase - проблема структуры данных для извлечения объекта из вложенной структуры
- 30. Лучший вид структуры данных для репликации структуры каталогов в Java?
Согласен. Книга Гусфилда очень обширна. – awesomo 2010-11-30 07:59:06