У меня есть data.frame в R, который для простоты имеет один столбец, который я хочу отделить. Это выглядит следующим образом:tidyr отдельно только первые n экземпляров
V1
Value_is_the_best_one
This_is_the_prettiest_thing_I've_ever_seen
Here_is_the_next_example_of_what_I_want
Мой реальные данные очень велико (миллионы строк), поэтому я хотел бы использовать отдельную функцию tidyr в (потому что это удивительно быстро), чтобы выделить только первые несколько экземпляров , Я хотел бы результат будет следующим:
V1 V2 V3 V4
Value is the best_one
This is the prettiest_thing_I've_ever_seen
Here is the next_example_of_what_I_want
Как вы можете видеть, разделитель _
столбец V4 может иметь разное количество сепараторов. Я хочу сохранить V4 (не отбрасывать его), но не нужно беспокоиться о том, сколько там вещей. Всегда будет четыре столбца (т. Е. Ни одна из моих строк не имеет только V1-V3).
Вот моя команда Отправной tidyr Я работаю с:
separate(df, V1, c("V1", "V2", "V3", "V4"), sep="_")
Это избавляется от В4 (и выплевывает предупреждения, что это не самая большая сделка).
Do вам просто нужно 'экстра = "сливаться" '? – aosmith
@ aosmith Да, спасибо. Я читал документацию как 10 раз и почему-то не понимал этого! Пожалуйста, положите его в ответ! –