Three strategies to tackle Big Data in Python and R - Rasmus Bååth

แชร์
ฝัง
  • เผยแพร่เมื่อ 14 ม.ค. 2025

ความคิดเห็น • 1

  • @darked89
    @darked89 2 ปีที่แล้ว

    If one has to load the same whole CSV several times then it makes sense to convert it to parquet, or even partitioned parquet dataset. DuckDB can query parquet (and CSV) files directly, so one can minimize RAM usage this way as needed.