2013-05-31 4 views
0

Я задал этот вопрос до here!. В то время я был обеспокоен получением результатов с помощью Google-Api, который работает отлично.Как получить идентификаторы из Freebase данной части имени (из Freebase Offline Dumps)?

На самом деле проблема с этим связана с тайм-аутами и, что более важно, с запросом на веб-интерфейс. Я хотел бы сделать это в автономном режиме, используя дампы данных Freebase. Есть ли простой способ сделать это?

Благодаря

ответ

1
zegrep $'\tns:type\.object\.name\t.*Bush.*' freebase-rdf-<date>.gz | cut -f 1 

даст вам список всех MIDs для тем, которые содержат строку «Буша» (из предыдущего примера) в названии.

Продлить регулярное выражение по мере необходимости включать такие вещи, как псевдонимы, любитель соответствия имен и т.д.

+0

Благодаря @tom. Это работает, но очень медленно. Я могу представить 40M объектов и поиск между ними таким образом может быть трудным. – Knight

+0

Я не знаю, должен ли я задавать этот вопрос в комментарии. Но здесь идет: я использую Google Topic Api для извлечения информации о теме/сущности, подобной этому: 'code'https: //www.googleapis.com/freebase/v1/topic//m/09937. Можно ли получить тот же вывод из свалок? – Knight

Смежные вопросы