Хотелось бы напечатать последние 50 строк ниже, используя что-то вроде tail function
ниже по ряду строк, используя sparklyr, без arrange
или collect
- некоторые из моих кадров большие и не имеют последовательных столбцов.Последние строки из Spark DataFrame (с использованием sparklyr & dplyr)
library(sparklyr)
library(dplyr)
library(Lahman)
spark_install(version = "2.0.0")
sc <- spark_connect(master = "local")
batting_tbl <- copy_to(sc, Lahman::Batting, "batting"); batting_tbl
batting_tbl %>% count # Number of rows
# n
# <dbl>
# 1 101332
batting_tbl %>% tail(., n = 50)
# Error: tail() is not supported by sql sources
Почему бы не назвать вам окончательный отсортированный data.frame перед вызовом хвост? 'tail (namedData, n = 50)' – CCurtis
Ваше предложение будет работать в сортировке по индексу, а затем с головой в Spark DataFrame. – eyeOfTheStorm