Distributed Machine Learning with Apache Spark / PySpark MLlib

แชร์
ฝัง
  • เผยแพร่เมื่อ 13 ม.ค. 2025

ความคิดเห็น • 23

  • @GregHogg
    @GregHogg  ปีที่แล้ว

    Take my courses at mlnow.ai/!

  • @nickie2222
    @nickie2222 ปีที่แล้ว +3

    Thank you for the video on mllib, I haven't watch much yet, but looks promising.
    The machine learning stuff starts about 12:00 - the beginning is a warm up to PySpark. Chapters/timestamps would have been helpful for a 40 min video (with each chapter being a different stage in the process or function).

  • @erint.4917
    @erint.4917 2 ปีที่แล้ว +3

    Great tutorial, Greg - really appreciate how you distilled such a comprehensive overview into a single video. Would you consider doing a video showing how to create a complete ML pipeline -- i.e., using output from Imputer(), StringIndexer(), OneHotEncoderEstimator(), VectorAssembler(), and VectorIndexer() -- for a dataset with multiple categorical and numerical features?

  • @davtg8172
    @davtg8172 ปีที่แล้ว

    Thx Greg ! It's a very good tutorial from pyspark ! comprehensive with a lot of examples

    • @GregHogg
      @GregHogg  ปีที่แล้ว

      Glad to hear it :)

  • @maximinmaster7511
    @maximinmaster7511 2 ปีที่แล้ว

    Thank you for this tutorial on PySpark !

    • @GregHogg
      @GregHogg  2 ปีที่แล้ว +1

      You're very welcome 🙂

  • @drjabirrahman
    @drjabirrahman 2 ปีที่แล้ว

    Good information Greg! Thanks for sharing.

    • @GregHogg
      @GregHogg  2 ปีที่แล้ว

      Glad to hear it! You're very welcome

  • @GregThatcher
    @GregThatcher 7 หลายเดือนก่อน

    Thanks!

    • @GregHogg
      @GregHogg  7 หลายเดือนก่อน

      Greg! You're too nice hahaha

  • @Value_Pilgrim
    @Value_Pilgrim 2 ปีที่แล้ว

    Thanks. That was pretty comprehensive.

    • @GregHogg
      @GregHogg  2 ปีที่แล้ว

      Glad to hear it!

  • @suman14san
    @suman14san ปีที่แล้ว

    Fantastic tutorial.

  • @ammaralhawashem560
    @ammaralhawashem560 8 หลายเดือนก่อน

    Thank you
    I just found one thing is confusing
    which is that you did the standard scaling AFTER the merging into one column
    shouldn't have you done it for each column before the merging?

    • @GregHogg
      @GregHogg  8 หลายเดือนก่อน +1

      I don't remember sorry. But you're probably right

    • @ammaralhawashem560
      @ammaralhawashem560 8 หลายเดือนก่อน

      @@GregHogg Thankyou for your reply
      I have done an experiment; in order to observe, I tried two features with large difference in values
      and use 5 million rows
      It seems even if we merge all the features before applying the scaling it will still calculate the parameters (mean & STD dev) for each feature
      In summary, you did NOT make any mistake

  • @فكّرفيها
    @فكّرفيها 9 หลายเดือนก่อน

    This is really helpful.
    Thank U

    • @GregHogg
      @GregHogg  9 หลายเดือนก่อน

      Super glad to hear it, you're very welcome! Thanks so much for the support ❤️

  • @arsheyajain7055
    @arsheyajain7055 2 ปีที่แล้ว

    Oh awesome thanks!

    • @GregHogg
      @GregHogg  2 ปีที่แล้ว

      No prob 😊

  • @shiminglu3940
    @shiminglu3940 2 ปีที่แล้ว +1

    I wish I had seen this when I took Econ 424(ml) at uw😂