Handling Missing Values in Pandas Dataframe | GeeksforGeeks

แชร์
ฝัง
  • เผยแพร่เมื่อ 4 ม.ค. 2025

ความคิดเห็น • 84

  • @GeeksforGeeksVideos
    @GeeksforGeeksVideos  3 ปีที่แล้ว +5

    WISH TO CONTRIBUTE VIDEOS ON GEEKSFORGEEKS? Please submit this Google Form - docs.google.com/forms/d/e/1FAIpQLScSVFlE-stz69M_l46xcwZlVRzDxT_91dlc-px5ytr7QHYmkQ/viewform

  • @hmuhamadzulfitri
    @hmuhamadzulfitri 10 หลายเดือนก่อน +5

    Addition:
    1- In case, you want to **impute** the null values of numerical column, you can check the distribution of the values first; If it's not skewed, you may use mean. In case it is skewed, you may use median.
    2- Generally, before we **delete** null values, we can check the proportion of the null values. If it's less than 5 % of the total dataset, we can opt to delete the null values.
    However, always take the context of our data before making any decision with the null values. 😬

  • @KeerthivasanSundararaman
    @KeerthivasanSundararaman 2 ปีที่แล้ว +6

    got a solution after about 30 mins of search.. Thank you made my day..

  • @-DanishShafi
    @-DanishShafi ปีที่แล้ว +2

    Thanks brother.
    The video was amazing, it cleared all my doubts.
    Rise and shine🎉

  • @darksector1389
    @darksector1389 ปีที่แล้ว +4

    You, sir, are amazing and a savior to my project 🙏

  • @mrtbhdr
    @mrtbhdr 2 ปีที่แล้ว +7

    geeksforgeeks never disappoints, thanks for this!

  • @chiemelieonu8846
    @chiemelieonu8846 3 หลายเดือนก่อน

    Thank you. The class, for me, was very insightful and rewarding. Worth my time.

  • @lukmanmanggo
    @lukmanmanggo ปีที่แล้ว +1

    Hi. very easy tutorial bro. As very beginner on python I can get it easy. Salute

  • @programsolve3053
    @programsolve3053 7 หลายเดือนก่อน

    Very nice and helpful lesson. Thanks for sharing. 🎉🎉🎉

  • @raumitraj8628
    @raumitraj8628 2 ปีที่แล้ว

    Bhut acha conceptual content hai yrr. It's really awesome!!!

  • @senglay5729
    @senglay5729 2 ปีที่แล้ว +2

    Clear explanation and easy to understand. Thank you!

  • @Gouthami-xr4eh
    @Gouthami-xr4eh 7 หลายเดือนก่อน

    Thank you .very nice and clear explanation .Easy for everyone to understand.thank you sir .

  • @noorelahi4792
    @noorelahi4792 2 ปีที่แล้ว

    Really amazing sir.
    after that wanna enroll for DS course.

  • @vndsanju9865
    @vndsanju9865 6 หลายเดือนก่อน

    chala chala TQ anna nuvu chepindhi chala thoraga ardham chesukunanu and chala bhaga ardham iendhi

  • @CuriousLearner_05
    @CuriousLearner_05 ปีที่แล้ว

    Thanks for the clarification , helped in clear a problem I was stuck in

  • @sougatamitra5112
    @sougatamitra5112 ปีที่แล้ว

    One of the best explanations!! kudos

  • @VoidmanEric
    @VoidmanEric 8 หลายเดือนก่อน

    so at 21:50 limit direction = 'forward" does work similar to method = 'pad"?

  • @saiprateek6643
    @saiprateek6643 2 ปีที่แล้ว

    Great resource for EDA ☺☺

  • @daysirivas30
    @daysirivas30 6 หลายเดือนก่อน

    Woooo!! Súper easy explained!!

  • @erison6791
    @erison6791 ปีที่แล้ว

    Thank you it is wonderful explanation. You answered my question perfectly.

  • @ketanverma7839
    @ketanverma7839 15 วันที่ผ่านมา

    Informative, can you please also make a video telling how to handle null values using ML algorithms ?

  • @poornimachougale8903
    @poornimachougale8903 10 หลายเดือนก่อน

    thanks for the informative video..🙏

  • @motivation_for_everything470
    @motivation_for_everything470 2 ปีที่แล้ว +1

    really nice
    session

  • @mariamartin6205
    @mariamartin6205 ปีที่แล้ว

    Thanks so much, this was really well explained and helpful.

  • @MrKbforex
    @MrKbforex 3 ปีที่แล้ว

    Great content..Exactly what I have been looking for... Thanks

  • @bosunomo
    @bosunomo 5 หลายเดือนก่อน

    Great content, thank you so much.

  • @kushangshah-be7hn
    @kushangshah-be7hn 7 หลายเดือนก่อน

    It was help ful, thanks bro

  • @yohanneskebede1573
    @yohanneskebede1573 5 หลายเดือนก่อน

    well explained. Can you make a video to fill in Na values by generating random numbers around the mean?

  • @priyankajoshi1953
    @priyankajoshi1953 2 ปีที่แล้ว

    Very nice explanation 👍

  • @as8401
    @as8401 2 ปีที่แล้ว

    very very clear thank you so much for this fantastic video...

  • @the-ghost-in-the-machine1108
    @the-ghost-in-the-machine1108 ปีที่แล้ว

    clear explanation. Thanks

  • @hibbajameel8779
    @hibbajameel8779 ปีที่แล้ว

    Thanks! You help me in my project ❤

  • @user-eg3sg1bz7g
    @user-eg3sg1bz7g 11 หลายเดือนก่อน +1

    this is so good and easy to understand thank you

  • @abouteverything1573
    @abouteverything1573 2 ปีที่แล้ว

    Clear explain ❤️

  • @mikefranko2832
    @mikefranko2832 ปีที่แล้ว +1

    But does it make any sense, to fill NA values with the next or the previous value? Or even more useless to fill it with a 0 or 5? Why would you do this?

  • @jagadeshkumar6174
    @jagadeshkumar6174 2 ปีที่แล้ว

    Thank you, very clear and nice tutorial......

  • @falcan7752
    @falcan7752 9 หลายเดือนก่อน

    Nice one Mate!!!!

  • @abebebirhane7332
    @abebebirhane7332 2 ปีที่แล้ว

    good presentation and nice knowledge

  • @AteetNP
    @AteetNP ปีที่แล้ว +5

    when should we drop a row?, i'm always fill the values with mean, median, mode etc, because rest of the columns seems importand.

  • @bennguyen1313
    @bennguyen1313 ปีที่แล้ว

    How would you fill empty values (NaN or NA) in a list or dataframe with the last known good value?

  • @nyashagracenhandara7757
    @nyashagracenhandara7757 2 ปีที่แล้ว

    thank you the explanation is clear and helpful

  • @abdoulkarim1468
    @abdoulkarim1468 2 ปีที่แล้ว

    thank you ; very good explanation

  • @Ayanshedipelly2312
    @Ayanshedipelly2312 6 หลายเดือนก่อน +1

    We have to take care of data types also before filling with any value

  • @radhakrishna.kalluri7192
    @radhakrishna.kalluri7192 2 ปีที่แล้ว

    Good job... keep up good work

  • @Chris-si4ox
    @Chris-si4ox ปีที่แล้ว

    this is brilliant thanks

  • @moatazsakr5435
    @moatazsakr5435 2 ปีที่แล้ว

    thanks so much on this video ❤

  • @bagushari1886
    @bagushari1886 2 ปีที่แล้ว

    How to fillna using interpolate method in the some column in once time?

  • @Uzi5272
    @Uzi5272 5 หลายเดือนก่อน

    thank you for this video

  • @johnbainbridge1931
    @johnbainbridge1931 ปีที่แล้ว

    I need intelligent filling, eg filling NaN with the mean of a data observation's category. E.g. car weight is missing, but we know it's SUV, so we apply average SUV weight.

  • @khushaldodeja8267
    @khushaldodeja8267 2 ปีที่แล้ว

    Clean. Thanks!

  • @raghunathanp3734
    @raghunathanp3734 3 ปีที่แล้ว +1

    Great content

  • @tarblood
    @tarblood 2 ปีที่แล้ว

    thnx it is a good explanation

  • @MelissaLu-v5t
    @MelissaLu-v5t ปีที่แล้ว +1

    Hi Sir, great video, one question, when fill in the mean(), or max() for certain column, the entire whole dataframe was filled in with that mean() even the categorical column, can I just fill in the mean for that column but keep the other columns unchanged?

    • @mohdzohairrizvi4377
      @mohdzohairrizvi4377 ปีที่แล้ว

      did you get the answer to your question?
      I also needed the same question to be answered.

    • @jodysidney9761
      @jodysidney9761 ปีที่แล้ว

      @@mohdzohairrizvi4377 Create a dictionary eg fillna({'colunmname1': 0, 'columnname2':5}). It will replace nulls in column1 with 0 and nulls in column 2 with 5

  • @kakashiaravind221
    @kakashiaravind221 ปีที่แล้ว

    Sir, Let us the above as same example, now i need to save the dataset(after handiling the missing value) as csv file

  • @csit3093
    @csit3093 ปีที่แล้ว

    Super class

  • @v44s82
    @v44s82 ปีที่แล้ว

    #2
    f = lambda df=df_rec: df.isna().sum(axis=0)
    result = f(df_rec)
    print(result)

  • @jimymunandar5319
    @jimymunandar5319 2 ปีที่แล้ว

    how about fill the null value if the datasets is categkrical

  • @haripriya9101
    @haripriya9101 11 หลายเดือนก่อน

    can we have a mean value for pad or bill

  • @milliekim5072
    @milliekim5072 2 ปีที่แล้ว

    Thank you so much!

  • @navaneethangn1215
    @navaneethangn1215 2 ปีที่แล้ว

    Thanks Dude!

  • @ajaykushwaha-je6mw
    @ajaykushwaha-je6mw 2 ปีที่แล้ว

    Hi Team,
    I want to replace missing value in original df. I used below code but it is not working, kindly help.
    df[(df['Age'].isnull()) & (df['Pclass']==2)].fillna(29)

  • @djaysse
    @djaysse 3 ปีที่แล้ว

    Thank you, your explanations are very clear! How can I follow more courses by Akshit Madan?

  • @srikanthkoltur6911
    @srikanthkoltur6911 3 ปีที่แล้ว +1

    It was truly great
    thanks

  • @nikomangrustini7553
    @nikomangrustini7553 ปีที่แล้ว

    I'm sorry Mr, can you make tutorial handling missing values with interpolasi linier method?

  • @hemkumarreddymaryada8140
    @hemkumarreddymaryada8140 ปีที่แล้ว

    Find the number of rows with missing values means
    Can I use df.isnull().sum().sum() in Python ?
    Can anyone , please answer me ?

  • @salahotman8450
    @salahotman8450 หลายเดือนก่อน

    Thanks

  • @v44s82
    @v44s82 ปีที่แล้ว

    #1
    df_rec = pd.read_csv("recommendation.csv")
    print(df_rec)
    print(df_rec.dtypes)

  • @animehunter2169
    @animehunter2169 2 หลายเดือนก่อน

    what if the missing values are defined by "-"

  • @uniqueuday8569
    @uniqueuday8569 ปีที่แล้ว

    Filling and replacing is same i think?

  • @sravankumar3411
    @sravankumar3411 2 ปีที่แล้ว

    Bro hw remove the $ symbol in column

  • @venkateshpeddinti5601
    @venkateshpeddinti5601 ปีที่แล้ว

    👏

  • @drewbal2265
    @drewbal2265 2 หลายเดือนก่อน

    for i in range(108):
    print("Thank you")

  • @v44s82
    @v44s82 ปีที่แล้ว

    A LEUZ
    L fichier .zip eli baathhouli ghazi mafihech questionet, fih les fichiers csv wl fichier jupyter mais maghir questions, EKTEBLI LES QUESTIONS 1) ... 2).. F KOL COMMENTAIRE WAHDOU WALA MABADDHOM WALA KIMA THEB wena taw nekteblek b ay façon
    juste hajti bel question chnia 1) .. 2) .. 3) ..

  • @rajulgupta3614
    @rajulgupta3614 10 หลายเดือนก่อน

    you should explain in which scenario which type of filling method is appropriate or suitable this is not a good video
    for example if we have outliers then we can not use mean

  • @sudeep2580
    @sudeep2580 3 ปีที่แล้ว

    print"(Thanks for showing so many methods")

  • @RitwikKapur
    @RitwikKapur 3 หลายเดือนก่อน

    luv u

  • @fernandojackson7207
    @fernandojackson7207 ปีที่แล้ว

    I used the nan at the Indian restaurant and the waiter brought some bread.

  • @hadirdammak5055
    @hadirdammak5055 ปีที่แล้ว +1

    hey

    • @v44s82
      @v44s82 ปีที่แล้ว

      ebaathouli les questions
      ektebli juste 1) .. wala 2).. commentaire w to njeweb west l comment
      l fichier eli baathou ghazi mafihech questions ferghin 1) 2) 3) ...

  • @v44s82
    @v44s82 ปีที่แล้ว

    #3
    df_rec = df_rec.dropna(subset=["recommendation"])
    df_rec = df_rec.dropna(subset=df_rec.columns)
    df_rec = df_rec.drop_duplicates()
    print(f(df_rec))
    df_rec

  • @mohdzohairrizvi4377
    @mohdzohairrizvi4377 ปีที่แล้ว

    how to replace the value of only a particular column by the mean of that column?