У меня есть таблица, которая хранит информацию о взаимоотношениях между парами пользователей:Есть ли эффективный способ объединения двух таблиц?
{user1, user2}
и таблицы о том, как пользователи обзора услуги:
{user, review}
я хотел бы таблицу, которая сочетает в себе следующее:
{user1, user1_review, user2, user2_review}
Я делал это на тестовых данных на 1) создание продукта обзора с псевдонимом сам по себе, чтобы дать:
user1, review1, user2, review2
1, good, 2, poor
1, good, 3, great
2, poor, 1, good
2, poor, 3, great
3, great, 1, good
3, great, 2, poor
, а затем 2) присоединение к нему с помощью таблицы отношений с пользователем, в результате чего получается таблица, в которой отображаются только те пары пользователей, у которых есть отношения, а также то, что они думают об услуге.
Это работает отлично, но я не могу его масштабировать. Фактическая таблица обзора составляет 700 МБ в виде текстового файла, и я запускаю память приложения при запуске запроса для создания продукта, большая часть которого будет удалена на этапе 2 в любом случае.
Есть ли другой способ, который я могу организовать для достижения того, чего хочу?
Вы говорите, что 700 МБ в виде текстового файла, но теперь хранятся данные в реальной таблице dbms? Определения таблиц, любые индексы и т. Д.? – jarlh
какую базу данных вы используете? есть ли какие-либо индексы? – learningNew
Использование пакета sqldf в R. Нет индексов только обычного текста, сохраненного в формате CSV. – ThomasC