Я искал ответ или решение этой задачи без успеха, так что я извиняюсь, если это избыточно.Рандомизировать данные между двумя столбцами в R
Я хочу рандомизировать данные между двумя столбцами. Это должно имитировать ошибочную идентификацию видов в данных полей растительности, поэтому я хочу назначить некоторую вероятность ошибочной идентификации между этими двумя столбцами. Я бы предположил, что есть способ сделать это, используя sample
или пакет «переместить».
Я приведу некоторые доступные данные для примера.
library (vegan)
data (dune)
Если вы наберете head (dune)
, то вы можете увидеть, что это кадр данных с сайтами в качестве строк и видов как колонны. Для удобства мы можем предположить, что некоторые полевые технологии могут ошибочно идентифицировать Poa pratensis и Poa trivialis.
poa = data.frame(Poaprat=dune$Poaprat,Poatriv=dune$Poatriv)
head(poa)
Poaprat Poatriv
1 4 2
2 4 7
3 5 6
4 4 5
5 2 6
6 3 4
Что бы лучший способ рандомизации значения между этими двумя столбцами (перенося друг с другом и/или добавление к одному, когда оба присутствуют). Полученные данные могут выглядеть так:
Poaprat Poatriv
1 6 0
2 4 7
3 5 6
4 5 4
5 0 7
6 4 3
P.S.
Для того, чтобы выжить экологом, пожалуйста, поймите, я сделал этот пример в интересах времени и знаю, что относительные значения покрытия не являются аддитивными. Прошу прощения за то, что вам нужно это сделать.
*** Редактирование: для большей ясности тип данных, которые будут рандомизированы, будет составлять проценты оценки покрытия (поэтому значения между 0% и 100%). Данные в этом кратком примере являются относительными оценками покрытия, а не считаются.
Randomize в соответствии с тем, что распределение/весов? если невзвешенное нормальное распределение прекрасное, то почему не просто 'unique()' объединенные столбцы и добавление комбинированных столбцов и 'sample()' из него? В противном случае 'mapply()' или 'purrr :: map2()' по столбцам и произвольно добавлять или изменять значения таким образом? – hrbrmstr
Предположительно, если кто-то не может отличить двух видов хорошо, распределение будет, вероятно, равномерным случайным, а не нормальным. Также нет оснований полагать, что он симметричен. Все записи могут быть для одного вида, или член поля может случайно выбирать между двумя (то есть на основе неправильных символов). Извините, я должен был быть более ясным. – NDD