2012-01-24 2 views
1

Я знаю, что это возможно неявное использование для php, но я работаю над идеей ориентироваться в геноме человека довольно интересным образом.Могу ли я анализировать hg19.2bit с php?

Проблема заключается в том, что мне нужно знать, могу ли я написать PHP-скрипт для анализа свободно доступных данных, и если да, то как мне начать? Существуют ли какие-либо скрипты php для этого?

+0

"Can"? Конечно. Почти любой язык, содержащий Тьюринга, может содержать написанный в нем парсер. –

ответ

0

Я предлагаю создать проект базы данных (MySQL), который имеет подмножество данных, которые вы хотите изучить в приложении PHP.

Затем найдите способ загрузки данных в эту схему данных. Для загрузки вы можете использовать более мощный язык, чем PHP по вашему выбору, это могут быть C#, F #, Haskell или что-то еще.

Это разделение поможет упростить работу, а не делать все это на PHP.

+0

Это не приложение php, и, конечно же, идея состоит в том, чтобы хранить данные в базе данных, например mySQL. Вопрос был в том, как я могу разобрать файл HG19.2bit с помощью php. – T9b

0

Вам придется написать парсер для этого, но это должно быть довольно просто: http://jc.unternet.net/genome/2bitformat.html

И пример в Perl: http://www.perlmonks.org/?node_id=672251

+0

Я добираюсь туда, но не совсем. Я могу, возможно, использовать 'unpack()' в php, но размер файла составляет около 800 МБ. – T9b

+0

Возможно, вам захочется заглянуть в Zend IO Reader из проекта php-reader. Я не играл с ним сам, но похоже, что это будет трюк: http://code.google.com/p/php-reader/source/browse/trunk/src/Zend/Io/Reader.php и http://code.google.com/p/php-reader/ –

Смежные вопросы