У меня есть два больших набора данных. Один из них старый, а второй - тот же, что и первый. Разница в том, что вторая имеет новые строки, обновленные Value
и недостающие строки по сравнению с первым набором данных. Я хотел бы сохранить все в новом наборе данных и заполнить его недостающими строками (комбинации Date
и Code
), которые присутствуют в старом наборе данных. Порядок не важен.Заполнение отсутствующих строк двумя кадрами данных
Старый набор данных:
Date Code Value
2015-10-01 1 145
2015-10-01 1 175
2015-11-01 6 112
2015-12-01 2 160
2016-01-01 6 124
2016-01-01 6 572
2016-02-01 5 160
2016-02-01 1 574
Новый набор данных:
Date Code Value
2015-10-01 1 145
2015-10-01 2 1452
2015-11-01 6 125
2015-12-01 2 160
2016-01-01 6 1501
2016-01-01 6 572
2016-03-01 9 452
2016-03-01 7 500
Выход:
Date Code Value
2015-10-01 1 145
2015-10-01 2 1452
2015-11-01 6 125
2015-12-01 2 160
2016-01-01 6 1501
2016-01-01 6 572
2016-03-01 9 452
2016-03-01 7 500
2015-10-01 1 175
2016-02-01 5 160
2016-02-01 1 574
Когда нет соответствия комбинации Date
и Code
соответствующей строки из старый набор данных. На выходе последние три строки поступают из старого набора данных. Я смотрел на разные должности без удачи, чтобы найти то, что мне нужно.
'final_df <- anti_join (oldds, newds, by = c (« Дата »,« Код »))' почти работает, но не обнаруживает эта строка '2015-10-01 1 175', где только «Код» изменился. Более того, я получаю это предупреждающее сообщение «объединение факторов с разными уровнями, принуждение к символьному вектору» – noblabla
Хорошо, я понимаю, что я сделал. во-первых, anti_join возвращает часть ответа. Я отредактирую свой ответ. – theArun
Причина, по которой вы получаете предупреждение, связана с тем, что ваш столбец даты может быть установлен в качестве факторов, которые вы можете изменить, используя мое as.character() в столбцах даты – theArun