2012-05-02 3 views
0

Если в определенный день есть несколько записей, я хочу удалить все, кроме последней записи, в этот день. Например, в таблице ниже указаны записи с идентификаторами 9, 10, 12. Поэтому 9 и 10 следует удалить, так как запись с идентификатором 12 имеет самую последнюю дату.ActiveRecord: удалять повторяющиеся записи

id  date 
1 2012-04-25 00:00:00.000000 
2 2012-04-26 00:00:00.000000 
3 2012-04-23 00:00:00.000000 
4 2012-04-24 00:00:00.000000 
5 2012-05-01 00:00:00.000000 
6 2012-05-02 00:00:00.000000 
7 2012-05-03 00:00:00.000000 
8 2012-05-04 00:00:00.000000 
9 2012-04-30 00:30:00.000000 
10 2012-04-30 18:00:00.000000 
11 2012-04-29 00:00:00.000000 
12 2012-04-30 18:40:00.000000 
13 2012-05-05 00:00:00.000000 
14 2012-05-05 09:31:31.000000 

Здесь (грязные) Грабли задача, чтобы удалить дубликаты

task :remove_duplicate do 
    Rake::Task["remove_duplicate"].invoke 
end 

task :remove_duplicate => :environment do 
    weights = Weight.count(:group => "DATE(date)", :having => "COUNT(id) > 1") 
    weights_to_delete = [] 
    weights.each do |weight| 

    start_date = weight[0].to_date.beginning_of_day 
    end_date = weight[0].to_date.end_of_day 
    day_weights = Weight.where("date >= ? and date <= ?", start_date, end_date).order(:date) 
    day_weights[0..-2].each do |weight| 
     weights_to_delete.push weight.id 
    end 
    end 
    Weight.delete(weights_to_delete) 
end 

Хотя я могу удалить записи, как я объяснил, что я не доволен подходом я принимаю. Пожалуйста, направляйте меня, чтобы удалить дубликаты записей в определенную дату, сохраняя последний, только используя API ActiveRecord.

Спасибо, Амит Патель

ответ

4

Этот метод может быть медленным, поэтому я не рекомендую, если вы не работаете это периодически.

Weight.all.each do |weight| 
    Weight.order("id desc").where(date: weight.date).all.drop(1).each { |w| w.delete } 
end 
+0

Тише, но это сделало работу, и при использовании в качестве один раз операцию ввода предпочитают читать четко понятный код до скорости. – lime

0

Вы можете попробовать этот SQL запрос, чтобы удалить записи тот же день, но позднее один в тот же день

DELETE FROM weights USING weights weight WHERE (CAST(weights.date as Date) = CAST(weight.date as Date) AND weights.id < weight.id); 
Смежные вопросы