Train, Test, & Validation Sets | How to Train Machine Learning Models (Properly!!!)

แชร์
ฝัง
  • เผยแพร่เมื่อ 23 พ.ย. 2024

ความคิดเห็น • 28

  • @GregHogg
    @GregHogg  ปีที่แล้ว

    Take my courses at mlnow.ai/!

  • @djjiang3718
    @djjiang3718 3 ปีที่แล้ว +3

    Just want to say Thank you, Greg! love your content always good stuff! Keep up with hard work! Thanks for teaching and sharing !

    • @GregHogg
      @GregHogg  3 ปีที่แล้ว

      I really appreciate this, thanks so much and you're very welcome 😄😄

  • @PeterPan-xp2gl
    @PeterPan-xp2gl 2 ปีที่แล้ว +1

    Hey Greg, thanks for your video! Could you explain why you convert the dataframe to a numpy matrix? Since the whole procedure also works with data frames?

    • @ismailucuran4523
      @ismailucuran4523 ปีที่แล้ว +1

      probably its because he didn't use scikitlearn treain_test_split

  • @tartlord7061
    @tartlord7061 ปีที่แล้ว

    Great and easy to follow video, thanks!

  • @natureclipsreal
    @natureclipsreal 2 ปีที่แล้ว

    If I am using cross validation during the training process, can I still use a validation set after training the model?

  • @jyotikapatil2354
    @jyotikapatil2354 ปีที่แล้ว

    Only video explaining actual hyperparameter tuning using validation test.

  • @rEbelWooHer
    @rEbelWooHer ปีที่แล้ว

    Is it possible that you wrote the arguments of 'mean_absolute_error' in the wrong order?

  • @panagiotisgoulas8539
    @panagiotisgoulas8539 2 ปีที่แล้ว

    Cool. thanks for that.

  • @arsheyajain7055
    @arsheyajain7055 3 ปีที่แล้ว

    Oooh awesome!!

  • @mayreyes4402
    @mayreyes4402 2 ปีที่แล้ว

    when I try to find mean absolute error for linear_test_ preds the result when I run it is "ValueError: could not convert string to float: 'KS'" what should I do with that?

    • @itowindsor
      @itowindsor 6 หลายเดือนก่อน

      One of your feature might be a categorical one. Therefore your models can't work with it. One way to overcome it is to one hot encode this feature. It will increase the dimension of your features spaces (as you will have one more dimension for each category) but every algorithm will understand it

  • @nayliafiqah4072
    @nayliafiqah4072 ปีที่แล้ว

    Thank you so much;

    • @GregHogg
      @GregHogg  ปีที่แล้ว

      You're very welcome!!

  • @emekaanammah9207
    @emekaanammah9207 3 ปีที่แล้ว

    Where did you download the california housing test and train dataset from?

    • @GregHogg
      @GregHogg  3 ปีที่แล้ว

      Google Colab. Free cloud env

  • @kshitijalawandi4443
    @kshitijalawandi4443 3 ปีที่แล้ว

    This is awesome....

    • @GregHogg
      @GregHogg  3 ปีที่แล้ว

      Thank you!

  • @diazjubairy1729
    @diazjubairy1729 2 ปีที่แล้ว

    How to set the proportion of train, val and test of our dataset ?

    • @GregHogg
      @GregHogg  2 ปีที่แล้ว

      How technically, or what numbers should you use?

    • @diazjubairy1729
      @diazjubairy1729 2 ปีที่แล้ว

      @@GregHogg train : val : test = 50 : 20 : 30

    • @GregHogg
      @GregHogg  2 ปีที่แล้ว

      @@diazjubairy1729 is this a question?

    • @diazjubairy1729
      @diazjubairy1729 2 ปีที่แล้ว

      @@GregHogg that is the proportion that i want, how to split the dataset like that ?

    • @GregHogg
      @GregHogg  2 ปีที่แล้ว +1

      @@diazjubairy1729 sklearn train test split (do it twice), or shuffle a pandas DataFrame and get split indices

  • @pogiribhanuteja4650
    @pogiribhanuteja4650 3 ปีที่แล้ว

    When will be the next live session..?

    • @GregHogg
      @GregHogg  3 ปีที่แล้ว

      I think I'll be busy this weekend unfortunately. If not, this weekend, otherwise probably the weekend after.

  • @mehediazad1780
    @mehediazad1780 ปีที่แล้ว +1

    you confused me by your variable name