One Hot Encoder with Python Machine Learning (Scikit-Learn)

แชร์
ฝัง
  • เผยแพร่เมื่อ 28 พ.ย. 2024

ความคิดเห็น • 57

  • @shivi_was_never_here
    @shivi_was_never_here 7 หลายเดือนก่อน

    Thanks a lot Ryan! This has to be one of the best videos out here dealing with encoders. If only others were this easy!
    Thanks again.

    • @shivi_was_never_here
      @shivi_was_never_here 7 หลายเดือนก่อน

      Also, do I have to fit and transform all my sets? Or only the training set? Do I have to fit the test set? Thanks again!

  • @A-K-I-R-A-
    @A-K-I-R-A- 11 หลายเดือนก่อน +1

    Nice tutorial, clean and direct!

  • @aniketshrikondawar6598
    @aniketshrikondawar6598 2 หลายเดือนก่อน +1

    Please make sure all cells are visible on screen. Sometimes not able to view end of cell content.

  • @ahsanjamil1495
    @ahsanjamil1495 3 หลายเดือนก่อน +1

    in case if we have multiple variables which are non-ordinal, do we use the onehotencoder on all the variables at once by adding them to the list initially or do we do this one by one?

  • @omer4826
    @omer4826 7 หลายเดือนก่อน

    thanks a lot dude! really helped me grasp the basics!

  • @charlesmay1610
    @charlesmay1610 หลายเดือนก่อน

    Perfect explanation! very helpful :)

  • @alonzoslim
    @alonzoslim 11 หลายเดือนก่อน

    This is a great video. Explained in a manner that a newbie like myself can understand. Thank you.
    A question: What if the dataset contains multiple categorical variables (as well as numerical), and they are all required as input to make a prediction. How can one go about it?

    • @RyanAndMattDataScience
      @RyanAndMattDataScience  11 หลายเดือนก่อน +1

      Thank you! There are multiple ways to one hot encode the categorical variables. Check out my titanic video and or the house predictions. I show a few different processes

  • @ShirHaShiurim-mq1zj
    @ShirHaShiurim-mq1zj 23 วันที่ผ่านมา

    This video was so helpful, thank you. Think you could also make one on frequency encoding and the other types of encoding?

  • @AtanasVekiev
    @AtanasVekiev หลายเดือนก่อน

    Very good tutorial, but what about the "dummy variable" trap? I think you should drop one of these new variables.

  • @RyanAndMattDataScience
    @RyanAndMattDataScience  3 หลายเดือนก่อน

    Hey guys I hope you enjoyed the video! If you did please subscribe to the channel!
    If you want to watch a full course on Machine Learning check out Datacamp: datacamp.pxf.io/XYD7Qg
    Want to solve Python data interview questions: stratascratch.com/?via=ryan
    I'm also open to freelance data projects. Hit me up at ryannolandata@gmail.com
    *Both Datacamp and Stratascratch are affiliate links.

  • @message59
    @message59 10 หลายเดือนก่อน

    Thanks a lot was a great help :) hope you have a good day

  • @User11111-S
    @User11111-S หลายเดือนก่อน

    Hii...I have an error like OneHotEncoder._init_() got an unexpected keyword argument 'sparse'.... Also I already imported library which are necessary... please tell me what should I do😢

    • @RyanAndMattDataScience
      @RyanAndMattDataScience  หลายเดือนก่อน

      Join our discord and post your notebook

    • @User11111-S
      @User11111-S หลายเดือนก่อน

      @@RyanAndMattDataScience okay

  • @Futureyouth-be1bo
    @Futureyouth-be1bo 5 หลายเดือนก่อน

    dude how about if i have two different datasets while theier categorical values are different how can i do one hot encoding
    the first one has 9349 rows × 17 columns
    and the second one has 365 rows × 17 columns while if i make one hot encoding they will be produced
    for the first one they become 611 columns of hot encoding
    and the second one become 20 columns please help me how can i do this note the two datasets have Origin and destintion city names

    • @williamalexander5089
      @williamalexander5089 3 หลายเดือนก่อน

      u can merge them first, encode it, then split it again

  • @yasminwael-pl5fv
    @yasminwael-pl5fv 2 หลายเดือนก่อน

    thank you very much 💕

  • @eyadal-naimi3782
    @eyadal-naimi3782 10 หลายเดือนก่อน

    protect this man

  • @RyanAndMattDataScience
    @RyanAndMattDataScience  ปีที่แล้ว +5

    Have a need for a data project? Email me or fill out the form on my website.
    Looking for the code? Check out the article: Looking for the code? Check out the article: ryannolandata.com/one-hot-encoder/

  • @juanDoAs
    @juanDoAs ปีที่แล้ว

    Trying your code I get this error: 'AttributeError: 'OneHotEncoder' object has no attribute 'set_output''. Any idea why this is?

    • @juanDoAs
      @juanDoAs ปีที่แล้ว

      Nvm just needed to update scikit-learn

    • @RyanAndMattDataScience
      @RyanAndMattDataScience  ปีที่แล้ว

      Ok great. Everything else working properly?

  • @shadrinan90
    @shadrinan90 9 หลายเดือนก่อน

    Great explanation, thanks

  • @ayushparwal2210
    @ayushparwal2210 10 หลายเดือนก่อน +1

    thanks buddy it helps me !:)

  • @ginaross295
    @ginaross295 11 หลายเดือนก่อน

    Thank you so much for this video !!!!

  • @kablamo9999
    @kablamo9999 6 หลายเดือนก่อน

    Thank you!

  • @La_mia-r5z
    @La_mia-r5z 6 หลายเดือนก่อน

    Thank you ❤

  • @neerajchauhan1371
    @neerajchauhan1371 4 หลายเดือนก่อน

    Thanks buudy

  • @ttdddaa
    @ttdddaa 3 หลายเดือนก่อน

    thanks dude

  • @onurdatascience
    @onurdatascience ปีที่แล้ว

    Great video!

  • @swativarsha68
    @swativarsha68 ปีที่แล้ว

    lerant a lot! thanks!!

  • @PhilTag-ml6wd
    @PhilTag-ml6wd 7 หลายเดือนก่อน

    Stopped a bit short. Need to go through how to use the encoder for predicting and not just setting up for training. eg. enc.transform() on the features you need to run the prediction on . Has been a bit of a pain with the datatype.

    • @Aldotronix
      @Aldotronix 6 หลายเดือนก่อน

      I don’t know if i understand your comment but you can make a make_pipeline to build all preprocessing steps: use a ColumnTransformer to select the columns to one hot encode and use the one hot encoder. You can cross validate, fit and predict using the pipeline instead of building a model again.

    • @RyanAndMattDataScience
      @RyanAndMattDataScience  5 หลายเดือนก่อน

      I have some projects that do. I may remake this video in the furture

  • @leodexter191
    @leodexter191 5 หลายเดือนก่อน

    please go lil slow hard to understand

    • @RyanAndMattDataScience
      @RyanAndMattDataScience  5 หลายเดือนก่อน

      I'll have an article on this soon you can also check out

    • @leodexter191
      @leodexter191 5 หลายเดือนก่อน

      @@RyanAndMattDataScience thank you

  • @peidomolhado7016
    @peidomolhado7016 3 หลายเดือนก่อน

    skibi learn 😝😝😝

  • @usamaspeakscricket
    @usamaspeakscricket 2 หลายเดือนก่อน

    Thanks buddy