Thomas Bierhance: Polars - make the switch to lightning-fast dataframes

แชร์
ฝัง
  • เผยแพร่เมื่อ 16 ก.ค. 2024
  • In this talk, we will report on our experiences switching from Pandas to Polars in a real-world ML project. Polars is a new high-performance dataframe library for Python based on Apache Arrow and written in Rust. We will compare the performance of polars with the popular pandas library, and show how polars can provide significant speed improvements for data manipulation and analysis tasks. We will also discuss the unique features of polars, such as its ability to handle large datasets that do not fit into memory, and how it feels in practice to make the switch from Pandas. This talk is aimed at data scientists, analysts, and anyone interested in fast and efficient data processing in Python.
    github.com/datenzauberai/PyCo...
  • วิทยาศาสตร์และเทคโนโลยี

ความคิดเห็น • 13

  • @zerdofish9989
    @zerdofish9989 ปีที่แล้ว +9

    Polars changed my whole pipeline. I love it!

    • @datenzauberai
      @datenzauberai หลายเดือนก่อน

      I love it too! It really makes a difference!

  • @rokaskarabevicius
    @rokaskarabevicius หลายเดือนก่อน +1

    glad to hear I'm not the only one who finds pandas multi-index confusing.

    • @datenzauberai
      @datenzauberai หลายเดือนก่อน +1

      I think I've never met someone in person who is fluent in "multi-index-filtering" 😂

    • @ryan_chew97
      @ryan_chew97 3 วันที่ผ่านมา

      @@datenzauberaipretty much. I just ask chatgpt and half the time it’s wrong

  • @chobblegobbler6671
    @chobblegobbler6671 9 หลายเดือนก่อน

    Herr Schuler.. Offnen Sie die tur!

    • @datenzauberai
      @datenzauberai หลายเดือนก่อน

      Ich kaufe drei Umlaute

  • @rubendevroomen2637
    @rubendevroomen2637 5 หลายเดือนก่อน +1

    I cant use polars until it supports complex numbers

    • @datenzauberai
      @datenzauberai หลายเดือนก่อน

      It's definitely not a replacement for numpy for this kind of scientific computations.

  • @ScienceMinisterZero
    @ScienceMinisterZero 8 หลายเดือนก่อน +2

    Rust is the future of data science.

    • @floopybits8037
      @floopybits8037 6 หลายเดือนก่อน +1

      It is good for backuend programming. Not for actual DS

  • @slavikdoter
    @slavikdoter ปีที่แล้ว +1

    whenever i see a new orm i try to avoid it as long as possible

    • @datenzauberai
      @datenzauberai หลายเดือนก่อน

      It's not a tool for object-relational-mapping, so it would be totally fine to have look 😉