Apache Arrow in R - Larger-Than-Memory Data Workflows with Apache Arrow

NYC taxi data files

nyc_taxi$files

  [1] "/home/danielle/Datasets/nyc-taxi/year=2009/month=1/part-0.parquet" 
  [2] "/home/danielle/Datasets/nyc-taxi/year=2009/month=10/part-0.parquet"
  [3] "/home/danielle/Datasets/nyc-taxi/year=2009/month=11/part-0.parquet"
  [4] "/home/danielle/Datasets/nyc-taxi/year=2009/month=12/part-0.parquet"
  [5] "/home/danielle/Datasets/nyc-taxi/year=2009/month=2/part-0.parquet" 
  [6] "/home/danielle/Datasets/nyc-taxi/year=2009/month=3/part-0.parquet" 
  [7] "/home/danielle/Datasets/nyc-taxi/year=2009/month=4/part-0.parquet" 
  [8] "/home/danielle/Datasets/nyc-taxi/year=2009/month=5/part-0.parquet" 
  [9] "/home/danielle/Datasets/nyc-taxi/year=2009/month=6/part-0.parquet" 
 [10] "/home/danielle/Datasets/nyc-taxi/year=2009/month=7/part-0.parquet" 
 [11] "/home/danielle/Datasets/nyc-taxi/year=2009/month=8/part-0.parquet" 
 [12] "/home/danielle/Datasets/nyc-taxi/year=2009/month=9/part-0.parquet" 
 [13] "/home/danielle/Datasets/nyc-taxi/year=2010/month=1/part-0.parquet" 
 [14] "/home/danielle/Datasets/nyc-taxi/year=2010/month=10/part-0.parquet"
 [15] "/home/danielle/Datasets/nyc-taxi/year=2010/month=11/part-0.parquet"
 [16] "/home/danielle/Datasets/nyc-taxi/year=2010/month=12/part-0.parquet"
 [17] "/home/danielle/Datasets/nyc-taxi/year=2010/month=2/part-0.parquet" 
 [18] "/home/danielle/Datasets/nyc-taxi/year=2010/month=3/part-0.parquet" 
 [19] "/home/danielle/Datasets/nyc-taxi/year=2010/month=4/part-0.parquet" 
 [20] "/home/danielle/Datasets/nyc-taxi/year=2010/month=5/part-0.parquet" 
 [21] "/home/danielle/Datasets/nyc-taxi/year=2010/month=6/part-0.parquet" 
 [22] "/home/danielle/Datasets/nyc-taxi/year=2010/month=7/part-0.parquet" 
 [23] "/home/danielle/Datasets/nyc-taxi/year=2010/month=8/part-0.parquet" 
 [24] "/home/danielle/Datasets/nyc-taxi/year=2010/month=9/part-0.parquet" 
 [25] "/home/danielle/Datasets/nyc-taxi/year=2011/month=1/part-0.parquet" 
 [26] "/home/danielle/Datasets/nyc-taxi/year=2011/month=10/part-0.parquet"
 [27] "/home/danielle/Datasets/nyc-taxi/year=2011/month=11/part-0.parquet"
 [28] "/home/danielle/Datasets/nyc-taxi/year=2011/month=12/part-0.parquet"
 [29] "/home/danielle/Datasets/nyc-taxi/year=2011/month=2/part-0.parquet" 
 [30] "/home/danielle/Datasets/nyc-taxi/year=2011/month=3/part-0.parquet" 
 [31] "/home/danielle/Datasets/nyc-taxi/year=2011/month=4/part-0.parquet" 
 [32] "/home/danielle/Datasets/nyc-taxi/year=2011/month=5/part-0.parquet" 
 [33] "/home/danielle/Datasets/nyc-taxi/year=2011/month=6/part-0.parquet" 
 [34] "/home/danielle/Datasets/nyc-taxi/year=2011/month=7/part-0.parquet" 
 [35] "/home/danielle/Datasets/nyc-taxi/year=2011/month=8/part-0.parquet" 
 [36] "/home/danielle/Datasets/nyc-taxi/year=2011/month=9/part-0.parquet" 
 [37] "/home/danielle/Datasets/nyc-taxi/year=2012/month=1/part-0.parquet" 
 [38] "/home/danielle/Datasets/nyc-taxi/year=2012/month=10/part-0.parquet"
 [39] "/home/danielle/Datasets/nyc-taxi/year=2012/month=11/part-0.parquet"
 [40] "/home/danielle/Datasets/nyc-taxi/year=2012/month=12/part-0.parquet"
 [41] "/home/danielle/Datasets/nyc-taxi/year=2012/month=2/part-0.parquet" 
 [42] "/home/danielle/Datasets/nyc-taxi/year=2012/month=3/part-0.parquet" 
 [43] "/home/danielle/Datasets/nyc-taxi/year=2012/month=4/part-0.parquet" 
 [44] "/home/danielle/Datasets/nyc-taxi/year=2012/month=5/part-0.parquet" 
 [45] "/home/danielle/Datasets/nyc-taxi/year=2012/month=6/part-0.parquet" 
 [46] "/home/danielle/Datasets/nyc-taxi/year=2012/month=7/part-0.parquet" 
 [47] "/home/danielle/Datasets/nyc-taxi/year=2012/month=8/part-0.parquet" 
 [48] "/home/danielle/Datasets/nyc-taxi/year=2012/month=9/part-0.parquet" 
 [49] "/home/danielle/Datasets/nyc-taxi/year=2013/month=1/part-0.parquet" 
 [50] "/home/danielle/Datasets/nyc-taxi/year=2013/month=10/part-0.parquet"
 [51] "/home/danielle/Datasets/nyc-taxi/year=2013/month=11/part-0.parquet"
 [52] "/home/danielle/Datasets/nyc-taxi/year=2013/month=12/part-0.parquet"
 [53] "/home/danielle/Datasets/nyc-taxi/year=2013/month=2/part-0.parquet" 
 [54] "/home/danielle/Datasets/nyc-taxi/year=2013/month=3/part-0.parquet" 
 [55] "/home/danielle/Datasets/nyc-taxi/year=2013/month=4/part-0.parquet" 
 [56] "/home/danielle/Datasets/nyc-taxi/year=2013/month=5/part-0.parquet" 
 [57] "/home/danielle/Datasets/nyc-taxi/year=2013/month=6/part-0.parquet" 
 [58] "/home/danielle/Datasets/nyc-taxi/year=2013/month=7/part-0.parquet" 
 [59] "/home/danielle/Datasets/nyc-taxi/year=2013/month=8/part-0.parquet" 
 [60] "/home/danielle/Datasets/nyc-taxi/year=2013/month=9/part-0.parquet" 
 [61] "/home/danielle/Datasets/nyc-taxi/year=2014/month=1/part-0.parquet" 
 [62] "/home/danielle/Datasets/nyc-taxi/year=2014/month=10/part-0.parquet"
 [63] "/home/danielle/Datasets/nyc-taxi/year=2014/month=11/part-0.parquet"
 [64] "/home/danielle/Datasets/nyc-taxi/year=2014/month=12/part-0.parquet"
 [65] "/home/danielle/Datasets/nyc-taxi/year=2014/month=2/part-0.parquet" 
 [66] "/home/danielle/Datasets/nyc-taxi/year=2014/month=3/part-0.parquet" 
 [67] "/home/danielle/Datasets/nyc-taxi/year=2014/month=4/part-0.parquet" 
 [68] "/home/danielle/Datasets/nyc-taxi/year=2014/month=5/part-0.parquet" 
 [69] "/home/danielle/Datasets/nyc-taxi/year=2014/month=6/part-0.parquet" 
 [70] "/home/danielle/Datasets/nyc-taxi/year=2014/month=7/part-0.parquet" 
 [71] "/home/danielle/Datasets/nyc-taxi/year=2014/month=8/part-0.parquet" 
 [72] "/home/danielle/Datasets/nyc-taxi/year=2014/month=9/part-0.parquet" 
 [73] "/home/danielle/Datasets/nyc-taxi/year=2015/month=1/part-0.parquet" 
 [74] "/home/danielle/Datasets/nyc-taxi/year=2015/month=10/part-0.parquet"
 [75] "/home/danielle/Datasets/nyc-taxi/year=2015/month=11/part-0.parquet"
 [76] "/home/danielle/Datasets/nyc-taxi/year=2015/month=12/part-0.parquet"
 [77] "/home/danielle/Datasets/nyc-taxi/year=2015/month=2/part-0.parquet" 
 [78] "/home/danielle/Datasets/nyc-taxi/year=2015/month=3/part-0.parquet" 
 [79] "/home/danielle/Datasets/nyc-taxi/year=2015/month=4/part-0.parquet" 
 [80] "/home/danielle/Datasets/nyc-taxi/year=2015/month=5/part-0.parquet" 
 [81] "/home/danielle/Datasets/nyc-taxi/year=2015/month=6/part-0.parquet" 
 [82] "/home/danielle/Datasets/nyc-taxi/year=2015/month=7/part-0.parquet" 
 [83] "/home/danielle/Datasets/nyc-taxi/year=2015/month=8/part-0.parquet" 
 [84] "/home/danielle/Datasets/nyc-taxi/year=2015/month=9/part-0.parquet" 
 [85] "/home/danielle/Datasets/nyc-taxi/year=2016/month=1/part-0.parquet" 
 [86] "/home/danielle/Datasets/nyc-taxi/year=2016/month=10/part-0.parquet"
 [87] "/home/danielle/Datasets/nyc-taxi/year=2016/month=11/part-0.parquet"
 [88] "/home/danielle/Datasets/nyc-taxi/year=2016/month=12/part-0.parquet"
 [89] "/home/danielle/Datasets/nyc-taxi/year=2016/month=2/part-0.parquet" 
 [90] "/home/danielle/Datasets/nyc-taxi/year=2016/month=3/part-0.parquet" 
 [91] "/home/danielle/Datasets/nyc-taxi/year=2016/month=4/part-0.parquet" 
 [92] "/home/danielle/Datasets/nyc-taxi/year=2016/month=5/part-0.parquet" 
 [93] "/home/danielle/Datasets/nyc-taxi/year=2016/month=6/part-0.parquet" 
 [94] "/home/danielle/Datasets/nyc-taxi/year=2016/month=7/part-0.parquet" 
 [95] "/home/danielle/Datasets/nyc-taxi/year=2016/month=8/part-0.parquet" 
 [96] "/home/danielle/Datasets/nyc-taxi/year=2016/month=9/part-0.parquet" 
 [97] "/home/danielle/Datasets/nyc-taxi/year=2017/month=1/part-0.parquet" 
 [98] "/home/danielle/Datasets/nyc-taxi/year=2017/month=10/part-0.parquet"
 [99] "/home/danielle/Datasets/nyc-taxi/year=2017/month=11/part-0.parquet"
[100] "/home/danielle/Datasets/nyc-taxi/year=2017/month=12/part-0.parquet"
[101] "/home/danielle/Datasets/nyc-taxi/year=2017/month=2/part-0.parquet" 
[102] "/home/danielle/Datasets/nyc-taxi/year=2017/month=3/part-0.parquet" 
[103] "/home/danielle/Datasets/nyc-taxi/year=2017/month=4/part-0.parquet" 
[104] "/home/danielle/Datasets/nyc-taxi/year=2017/month=5/part-0.parquet" 
[105] "/home/danielle/Datasets/nyc-taxi/year=2017/month=6/part-0.parquet" 
[106] "/home/danielle/Datasets/nyc-taxi/year=2017/month=7/part-0.parquet" 
[107] "/home/danielle/Datasets/nyc-taxi/year=2017/month=8/part-0.parquet" 
[108] "/home/danielle/Datasets/nyc-taxi/year=2017/month=9/part-0.parquet" 
[109] "/home/danielle/Datasets/nyc-taxi/year=2018/month=1/part-0.parquet" 
[110] "/home/danielle/Datasets/nyc-taxi/year=2018/month=10/part-0.parquet"
[111] "/home/danielle/Datasets/nyc-taxi/year=2018/month=11/part-0.parquet"
[112] "/home/danielle/Datasets/nyc-taxi/year=2018/month=12/part-0.parquet"
[113] "/home/danielle/Datasets/nyc-taxi/year=2018/month=2/part-0.parquet" 
[114] "/home/danielle/Datasets/nyc-taxi/year=2018/month=3/part-0.parquet" 
[115] "/home/danielle/Datasets/nyc-taxi/year=2018/month=4/part-0.parquet" 
[116] "/home/danielle/Datasets/nyc-taxi/year=2018/month=5/part-0.parquet" 
[117] "/home/danielle/Datasets/nyc-taxi/year=2018/month=6/part-0.parquet" 
[118] "/home/danielle/Datasets/nyc-taxi/year=2018/month=7/part-0.parquet" 
[119] "/home/danielle/Datasets/nyc-taxi/year=2018/month=8/part-0.parquet" 
[120] "/home/danielle/Datasets/nyc-taxi/year=2018/month=9/part-0.parquet" 
[121] "/home/danielle/Datasets/nyc-taxi/year=2019/month=1/part-0.parquet" 
[122] "/home/danielle/Datasets/nyc-taxi/year=2019/month=10/part-0.parquet"
[123] "/home/danielle/Datasets/nyc-taxi/year=2019/month=11/part-0.parquet"
[124] "/home/danielle/Datasets/nyc-taxi/year=2019/month=12/part-0.parquet"
[125] "/home/danielle/Datasets/nyc-taxi/year=2019/month=2/part-0.parquet" 
[126] "/home/danielle/Datasets/nyc-taxi/year=2019/month=3/part-0.parquet" 
[127] "/home/danielle/Datasets/nyc-taxi/year=2019/month=4/part-0.parquet" 
[128] "/home/danielle/Datasets/nyc-taxi/year=2019/month=5/part-0.parquet" 
[129] "/home/danielle/Datasets/nyc-taxi/year=2019/month=6/part-0.parquet" 
[130] "/home/danielle/Datasets/nyc-taxi/year=2019/month=7/part-0.parquet" 
[131] "/home/danielle/Datasets/nyc-taxi/year=2019/month=8/part-0.parquet" 
[132] "/home/danielle/Datasets/nyc-taxi/year=2019/month=9/part-0.parquet" 
[133] "/home/danielle/Datasets/nyc-taxi/year=2020/month=1/part-0.parquet" 
[134] "/home/danielle/Datasets/nyc-taxi/year=2020/month=10/part-0.parquet"
[135] "/home/danielle/Datasets/nyc-taxi/year=2020/month=11/part-0.parquet"
[136] "/home/danielle/Datasets/nyc-taxi/year=2020/month=12/part-0.parquet"
[137] "/home/danielle/Datasets/nyc-taxi/year=2020/month=2/part-0.parquet" 
[138] "/home/danielle/Datasets/nyc-taxi/year=2020/month=3/part-0.parquet" 
[139] "/home/danielle/Datasets/nyc-taxi/year=2020/month=4/part-0.parquet" 
[140] "/home/danielle/Datasets/nyc-taxi/year=2020/month=5/part-0.parquet" 
[141] "/home/danielle/Datasets/nyc-taxi/year=2020/month=6/part-0.parquet" 
[142] "/home/danielle/Datasets/nyc-taxi/year=2020/month=7/part-0.parquet" 
[143] "/home/danielle/Datasets/nyc-taxi/year=2020/month=8/part-0.parquet" 
[144] "/home/danielle/Datasets/nyc-taxi/year=2020/month=9/part-0.parquet" 
[145] "/home/danielle/Datasets/nyc-taxi/year=2021/month=1/part-0.parquet" 
[146] "/home/danielle/Datasets/nyc-taxi/year=2021/month=10/part-0.parquet"
[147] "/home/danielle/Datasets/nyc-taxi/year=2021/month=11/part-0.parquet"
[148] "/home/danielle/Datasets/nyc-taxi/year=2021/month=12/part-0.parquet"
[149] "/home/danielle/Datasets/nyc-taxi/year=2021/month=2/part-0.parquet" 
[150] "/home/danielle/Datasets/nyc-taxi/year=2021/month=3/part-0.parquet" 
[151] "/home/danielle/Datasets/nyc-taxi/year=2021/month=4/part-0.parquet" 
[152] "/home/danielle/Datasets/nyc-taxi/year=2021/month=5/part-0.parquet" 
[153] "/home/danielle/Datasets/nyc-taxi/year=2021/month=6/part-0.parquet" 
[154] "/home/danielle/Datasets/nyc-taxi/year=2021/month=7/part-0.parquet" 
[155] "/home/danielle/Datasets/nyc-taxi/year=2021/month=8/part-0.parquet" 
[156] "/home/danielle/Datasets/nyc-taxi/year=2021/month=9/part-0.parquet" 
[157] "/home/danielle/Datasets/nyc-taxi/year=2022/month=1/part-0.parquet" 
[158] "/home/danielle/Datasets/nyc-taxi/year=2022/month=2/part-0.parquet"