Data Wrangling with PySpark for Data Scientists Who Know Pandas - Andrew Ray

แชร์
ฝัง
  • เผยแพร่เมื่อ 29 ม.ค. 2025

ความคิดเห็น • 38

  • @AlessandroBottoni
    @AlessandroBottoni 4 ปีที่แล้ว +10

    Fantastic introduction to PySpark for beginners. Hope to see Andrew Ray again on the stage for other presentations.

  • @ratkush
    @ratkush 6 ปีที่แล้ว +10

    Must watch Q n A session in the end. I loved it.

  • @fiddlepants5947
    @fiddlepants5947 5 ปีที่แล้ว +45

    Really nice how we see pandas and pyspark functions side-by-side!

    • @javonnii436
      @javonnii436 4 ปีที่แล้ว

      yea I thought the same!

  • @santil.7072
    @santil.7072 3 ปีที่แล้ว +1

    Does it mean that using pyspark sql is the best practice in data wrangling using spark?

  • @enes-the-cat-father
    @enes-the-cat-father 5 ปีที่แล้ว +3

    Thank you for such a great presentation for beginners!

  • @ZenvilleErasmus
    @ZenvilleErasmus 6 ปีที่แล้ว +3

    Cool talk and key differences nicely illustrated.

    • @harjeetkumar4632
      @harjeetkumar4632 6 ปีที่แล้ว

      Here are some more videos on spark Spark Interview Questions: th-cam.com/play/PL9sbKmQTkW05mXqnq1vrrT8pCsEa53std.html

  • @tanishasharma3665
    @tanishasharma3665 4 ปีที่แล้ว

    he provided with a really good comparison between the two!

  • @pratikmehta1152
    @pratikmehta1152 6 ปีที่แล้ว +39

    Volume is low! :(

  • @kevinlin5486
    @kevinlin5486 5 ปีที่แล้ว +2

    This a great video. Exactly what I'm looking for thanks very much.

  • @toygraphers240
    @toygraphers240 2 ปีที่แล้ว

    Thank you very much for your contribution.

  • @thedarkknight579
    @thedarkknight579 3 ปีที่แล้ว

    Thank you so much for the Session ❤️

  • @raphaels2103
    @raphaels2103 5 ปีที่แล้ว +6

    19:12, now pandas has an SQL support

  • @abrahamf80
    @abrahamf80 2 ปีที่แล้ว

    My path to data was a little bit unsual to say the least, started to work in the financial industry using databricks and now on side projects started to work on pandas... funny that I actually used this video backwards hehe

  • @willwright5181
    @willwright5181 3 ปีที่แล้ว

    Great intro!

  • @VishalSharma16
    @VishalSharma16 4 ปีที่แล้ว

    Super helpful, thanks for sharing!

  • @musasall5740
    @musasall5740 6 ปีที่แล้ว +4

    by just downloading and writing this code it will not work. You have to create a session.

  • @1over137
    @1over137 3 ปีที่แล้ว

    PySpark is great with it's read only. It all goes badly wrong when you try and write anything with a typed schema.

  • @alexnim4873
    @alexnim4873 4 ปีที่แล้ว

    great presentation!

  • @elliottharris4526
    @elliottharris4526 5 ปีที่แล้ว

    Would this be a good tool for combining large numbers of csvs into a single dataframe quickly and then performing manipulations on that dataframe before outputting a single csv?

  • @goedzo4361
    @goedzo4361 3 ปีที่แล้ว

    Really helpful

  • @Arjun147gtk
    @Arjun147gtk 4 ปีที่แล้ว +5

    I think I need a soundbox on full volume to hear this.

    • @jaspreet0305
      @jaspreet0305 3 ปีที่แล้ว

      I've the same issue, thanks to the captions, I saved a lot of money

  • @krishnakishorepeddisetti4387
    @krishnakishorepeddisetti4387 4 ปีที่แล้ว +1

    Which is better in databricks environment?? Python or R or SQL..reply in comments

    • @jimbocho660
      @jimbocho660 3 ปีที่แล้ว

      Most people seem to find SQL better.

  • @francischab2262
    @francischab2262 5 ปีที่แล้ว +13

    7:49

  • @Rabixter
    @Rabixter 5 ปีที่แล้ว

    Whats with the volume?

  • @xiaoyunzhang6878
    @xiaoyunzhang6878 3 ปีที่แล้ว +1

    Nebraska Alumni

  • @myshkinovavich
    @myshkinovavich 4 ปีที่แล้ว +2

    Too quiet please fix

  • @Tyokok
    @Tyokok 5 ปีที่แล้ว

    great tech video, but volume really ...

  • @Drivebyeasy
    @Drivebyeasy 7 ปีที่แล้ว

    Hey Andrew could you send me your Github link

  • @kaixianghuang8589
    @kaixianghuang8589 6 ปีที่แล้ว

    LOL good presentation, but unprepared for the Q &A

    • @TheBjjninja
      @TheBjjninja 5 ปีที่แล้ว +2

      Why did someone ask about uDF? What does UDF have to do with spark?

  • @Atlas-ck9vm
    @Atlas-ck9vm 4 ปีที่แล้ว

    Just use koalas.