Я смотрел видео [1] Грега Реды о Пандах, чтобы узнать, что может сделать Панда, как он сравнивается с data.table. Я был удивлен, узнав, как сложно объединить таблицы в data.table. Если вы смотрите видеоролик, в частности, с 49:00 до 52:00, вы увидите, что Pandas позволяет вам объединять таблицы на основе разных имен столбцов, и вы можете выбрать различные суффиксы для левой и правой таблиц. Я понимаю, что setkey используется для оптимизационных целей [2] и понимает, как объединить таблицы, используя одинаковые имена столбцов [3]. Я попробовал слияние данных.table, но с большим трудом установил параметр ключевого слова by=
, используя разные имена столбцов. Итак, вот мои вопросы.Объединение таблиц на основе разных имен столбцов
Возможно ли, в таблице данных, объединить таблицы на основе разных имен столбцов? Если да, то как? Если нет, почему бы и нет? Кроме того, более полезно, не будет ли эта функция полезна? Удивительно, что этот вопрос не появился раньше. Простите меня (и, пожалуйста, укажите мне их), если это было обсуждено ранее.
BTW, данные, о которых говорит Грег, найдены на его github [4].
- https://www.youtube.com/watch?v=1uVWjdAbgBg
- https://stackoverflow.com/a/13686768/3892933
- Joining tables with identical (non-keyed) column names in R data.table
- https://github.com/gjreda/pydata2014nyc
Vijay, обе функции реализованы в 1.9.5. Пожалуйста, сообщите нам на странице github, если у вас есть другие предложения по улучшению. Благодарю. – Arun
Спасибо, Арун. Теперь data.table ведет себя как обычный data.frame. Теперь я могу использовать data.table еще чаще! – Vijay
Возможный дубликат [слияния таблиц с разными именами столбцов] (http://stackoverflow.com/questions/16047253/merging-tables-with-different-column-names) –