2014-01-19 5 views
0

Я создаю приложение для iPhone, и для этого мне нужно получить время колокола для средней школы (и колледжей, если у них есть время колокола).
Время звонка, заканчивающееся классом времени. Примеры: Northville и Novi средние школыCrawler for iPhone app

Так что мне было интересно, как я должен ползать для всех этих данных. Я вижу 3 реальные варианты

  • Сканирование в Интернете для каждого учреждения и хранить колокол раз в формате JSON, который я могу загрузить или пакет с приложением. Резервное копирование, это кажется ОЧЕНЬ неэффективным

  • Дайте клиенту интерфейс типа поиска, который они могут использовать для поиска, а затем импортировать их время колокола. Так что я должен был бы разработать эту функциональность, вроде как , указывая нам на ваш звонок, возможно, даже позволить клиенту загружать изображения? сделать регулярное выражение, чтобы найти раз в колокол изображения/PDF/HTML и OCR для распознавания текста

  • Сделать это сообщество на основе, так что вы хотите загрузить раз, а затем, когда другие люди начинают выбирать свое учреждение X High School например, нечеткий поиск возвращает термин сообщества

Мне нравится вариант 2. Поэтому я ищу несколько советов о том, как программировать на Python? Objective-C? а затем как его исправить - веб-искатель, основанный на сообществах, Text recog - и как вы думаете, что я должен делать это в приложении.

ответ

1

Я думаю, что лучший способ поддерживать большую базу данных времени колокола, как и ваше описание, - сохранить его на веб-сервере в базе данных SQL (например, MySQL). Это означает, что вам нужно сохранить только одну копию своей базы данных, что упрощает ее обновление ... вместо того, чтобы периодически обновлять обновления приложений, вы просто заходите на свой веб-сервер и вставляете новые данные. Вы можете легко создать приложение, которое связывается с вашим веб-сервером с помощью PHP-скриптов. PHP-скрипты могут обрабатывать запросы к базе данных и передавать информацию в ваше приложение. Это дает вам лучшие части всех ваших вариантов выше.

Что касается сбора данных, есть несколько способов сделать это. Вы, конечно, можете комбинировать их, чтобы получить наиболее эффективный способ сбора данных:

  1. вручную ввести данные в вашу базу данных
  2. Наличие сообщества дополнения, так же, как SO или Wikipedia, для школ, которые еще не перечислены. Конечно, это может привести к дублированию и ложным данным, но это было бы самым простым для вас. Вы могли бы вводить данные пользователей в свое приложение и загружать их на свой веб-сервер, или даже иметь компонент веб-сайта на своем веб-сервере для двойной функциональности.
  3. Обратитесь к школьным администраторам и попросите их ввести расписание своих звонков. Это потребует некоторого маркетинга и коммуникации с вашей стороны, но в целом приведет к меньшему количеству рабочих и точных данных.
  4. Напишите веб-искатель с распознаванием текста/рисунка. Я бы избегал этого, если у вас нет большого опыта в области искусственного интеллекта, разработки базы данных и машинного обучения. Если у вас нет соответствующей степени или у вас не было полевого опыта, изучите первые три варианта.

Ниже приведены некоторые условия поиска, которые помогут вам начать работу: PHP, MySQL, веб-хостинг, веб-сервер.

+0

Спасибо, я решил сделать комбинацию сначала вручную добавив несколько раз в базу данных SQL, а затем разрешить добавление сообщества. – AndrewSB

+0

Удачи вам в вашем проекте! – user2105505