EDA using Bivariate and Multivariate Analysis | Day 21 | 100 Days of Machine Learning

แชร์
ฝัง
  • เผยแพร่เมื่อ 12 ต.ค. 2024

ความคิดเห็น • 120

  • @rose9024
    @rose9024 3 ปีที่แล้ว +15

    Best video seen on EDA till date...Great Work!

  • @ranirathore4176
    @ranirathore4176 2 ปีที่แล้ว +37

    Date : 27 July
    Status : Done ✅
    Summary:
    Learn about bivariant and multivariate analysis , bivariant analysis means analysis two columns together , and multivariate means analysing two or more columns together.
    1. Numerical Numerical
    ☘️ Scatterplot
    ☘️ Pair plot
    ☘️ Line plot
    2. Numerical - Categorical
    ☘️Boxplot
    ☘️ Barplot
    ☘️ Distplot
    3 Categorical Categorical
    ☘️Heatplot
    ☘️Clustermap

    • @sid_x_18
      @sid_x_18 11 หลายเดือนก่อน

      ab kya kar rahe ho ?

    • @monikrayu2546
      @monikrayu2546 3 หลายเดือนก่อน

      @@sid_x_18 +1

  • @katadermaro
    @katadermaro 3 ปีที่แล้ว +14

    Thoroughly enjoying this series. Thank you so much Nitish!

  • @Raj-v8j5u
    @Raj-v8j5u ปีที่แล้ว +3

    I really enjoy the way you go deep in analysis

  • @Engineer884
    @Engineer884 9 หลายเดือนก่อน +22

    5:00, scatterplot might have updated, correct way: sns.scatterplot(x=tips['total_bill'],y=tips['tip'])
    6:26, sns.scatterplot(x=tips['total_bill'],y=tips['tip'],hue=tips['sex'])
    10:30 sns.barplot(x=titanic['Pclass'],y=titanic['Age'])
    16:10 sns.displot(x =titanic['Age'],kde=True,stat='density',linewidth=0)
    18:45 sns.histplot(titanic[titanic['Survived']==0]['Age'],kde=True, stat="density", linewidth=0,fill=False)
    sns.histplot(titanic[titanic['Survived']==1]['Age'],kde=True, stat="density", linewidth=0,fill=False)

    • @CatalystOfMisfortune
      @CatalystOfMisfortune 6 หลายเดือนก่อน +1

      groupby is not working for my case

    • @Bhartiya766
      @Bhartiya766 6 หลายเดือนก่อน

      thank you bhai

    • @SYETB076YashJadhav
      @SYETB076YashJadhav 5 หลายเดือนก่อน

      thanks bro

    • @preetiyadav9891
      @preetiyadav9891 5 หลายเดือนก่อน

      thankyou buddy

    • @KRISHNAGupta-u1m
      @KRISHNAGupta-u1m 5 หลายเดือนก่อน

      @@CatalystOfMisfortune i am facing the same problem

  • @tanmaygupta8288
    @tanmaygupta8288 9 หลายเดือนก่อน +1

    writing code in notebook alongside with you is a great way to learn things, thanks!

  • @zkhan2023
    @zkhan2023 3 ปีที่แล้ว +5

    Every time amazing information comes.Thanks, sir

  • @ujefmalek77
    @ujefmalek77 ปีที่แล้ว +4

    Yout videos are amazing 🔥🔥,
    You are most underrated TH-camr😶

  • @introgaming7540
    @introgaming7540 5 หลายเดือนก่อน +3

    BEST VIDEO IN ENTIRE UNIVERSE FOR EDA

  • @harshkondkar3193
    @harshkondkar3193 2 ปีที่แล้ว +5

    Hello sir, amazing content.
    I had one request. Could you make a video on how to perform hypothesis testing in python while doing bivariate analysis?
    Would be really helpful to a lot of people.
    Thanks.

  • @SunilVishwakarma-r1m
    @SunilVishwakarma-r1m 10 หลายเดือนก่อน +4

    slight modification in code at 33:17 is new = flights.groupby('year').sum('passengers').reset_index() and sns.lineplot(x=new['year'],y=new['passengers'])

    • @VaishnaviShrivastava-z2b
      @VaishnaviShrivastava-z2b 3 หลายเดือนก่อน

      hey, 26:10 (titanic.groupby('Embarked').mean()['Survived']*100) TypeError: agg function failed [how->mean,dtype->object] please help

    • @lethalgaming7087
      @lethalgaming7087 3 หลายเดือนก่อน

      @@VaishnaviShrivastava-z2b (titanic.groupby('Embarked')['Survived'].mean()*100)

  • @fit_tubes_365
    @fit_tubes_365 หลายเดือนก่อน +4

    Course Started : ML
    Lecture-01: 14/08/2024
    Lecture-02: 14/08/2024
    Lecture-03: 14/08/2024
    Lecture-04: 14/08/2024
    Lecture-05: 14/08/2024
    Lecture-06: 15/08/2024
    Lecture-07: 15/08/2024
    Lecture-08: 15/08/2024
    Lecture-09: 15/08/2024
    Lecture-10: 15/08/2024
    Lecture-11: 16/08/2024
    Lecture-12: 16/08/2024
    Lecture-13: 17/08/2024
    Lecture-14: 17/08/2024
    Lecture-15: 18/08/2024
    Lecture-16: 19/08/2024
    Lecture-17: 20/08/2024
    Lecture-18: 20/08/2024
    Lecture-19: 21/08/2024
    Lecture-20: 21/08/2024
    Lecture-21: 22/08/2024

  • @SamritiKhuranaCSE146
    @SamritiKhuranaCSE146 11 หลายเดือนก่อน +1

    Sir aap jo jo bhi dataset use krte ho please uski Excel file ka link description me de diya kro ese sahi se practice nhi ho pati and really your videos are so awesome😄

  • @priyanshugupta9192
    @priyanshugupta9192 2 ปีที่แล้ว +1

    20:00 distplot() is depreciated by seaborn . For kdeplot, which gives probability density, it is giving slightly different graph, which is calculated in above video

    • @VaishnaviShrivastava-z2b
      @VaishnaviShrivastava-z2b 3 หลายเดือนก่อน

      hey, 26:10 (titanic.groupby('Embarked').mean()['Survived']*100) TypeError: agg function failed [how->mean,dtype->object] please help

  • @manujkumarjoshi9342
    @manujkumarjoshi9342 ปีที่แล้ว

    Beautiful way of doing EDA

  • @PM-ps5po
    @PM-ps5po 2 ปีที่แล้ว

    Best Channel on the Earth to Learn Data Science from Scratch🔥🔥🔥🔥

  • @GamerBoy-ii4jc
    @GamerBoy-ii4jc 3 ปีที่แล้ว +6

    Sir is your playlist of 100 days of Machine learning enough to Applying for internship in company?
    Or i need to do projects more upon these topics and practicals?Please suggest me. Thanks!

    • @messiisthebest
      @messiisthebest ปีที่แล้ว +1

      did you get the internship , i think you need to do more projects

  • @beit2608
    @beit2608 9 หลายเดือนก่อน +1

    great exxplanation
    very in sensitive

  • @allishere-study5206
    @allishere-study5206 11 หลายเดือนก่อน

    Salute hai sir aapko kya padhate aap

  • @manishpingale6558
    @manishpingale6558 3 หลายเดือนก่อน

    EDA is really an art!

  • @sameer9045
    @sameer9045 ปีที่แล้ว +1

    Great explanation.
    I applied pair plot on a 17 column long dataset .
    And it showed me more than 100 plots.
    I don't know how to pick which one and understand.😵😵

  • @rajathpoojari7873
    @rajathpoojari7873 10 หลายเดือนก่อน

    Awesome content and explanation. Thank you!

  • @not_amanullah
    @not_amanullah ปีที่แล้ว +1

    didn't find better playlist than this TYSM❤️

  • @arun5351
    @arun5351 3 ปีที่แล้ว +1

    Very informative lecture and great analysis

  • @AmirJaved565
    @AmirJaved565 5 หลายเดือนก่อน

    CampusX unmatched...Love from Pakistan

  • @Raj-v8j5u
    @Raj-v8j5u ปีที่แล้ว

    I think finding great insights will take u long long way

  • @vKNemesis
    @vKNemesis 2 ปีที่แล้ว +1

    brother the way u explained i m loving it :)🙂

  • @darshanayenkar
    @darshanayenkar 2 ปีที่แล้ว

    Best Video ever seen for ML

  • @RahulSingh-t1k1r
    @RahulSingh-t1k1r 10 หลายเดือนก่อน +1

    you are best sir

  • @shaktis6877
    @shaktis6877 3 หลายเดือนก่อน

    26:14 not sherlock holmes its being ACP Pradyuman from CID

  • @NamrataGuru
    @NamrataGuru ปีที่แล้ว

    tx a lot ...made easy to my learning ...

  • @saurabhbarasiya4721
    @saurabhbarasiya4721 3 ปีที่แล้ว +1

    your videos are very helpfull

  • @mdyounusahamed6668
    @mdyounusahamed6668 ปีที่แล้ว

    Awesome. Gave me a lot of insights.

  • @nrted3877
    @nrted3877 3 หลายเดือนก่อน

    Thankyou Sir

  • @arshad1781
    @arshad1781 3 ปีที่แล้ว +1

    Thanks

  • @yogendrajoshi7976
    @yogendrajoshi7976 2 ปีที่แล้ว

    you are the best sir.

  • @jahidmdhasan1021
    @jahidmdhasan1021 ปีที่แล้ว +2

    At 16:25 which extension you have used to check for hue feature in distplot

    • @Engineer884
      @Engineer884 9 หลายเดือนก่อน

      shift+tab

  • @JACKSPARROW-ch7jl
    @JACKSPARROW-ch7jl ปีที่แล้ว

    thanxx nitish

  • @itatul
    @itatul 2 ปีที่แล้ว

    Amazing explanation .. thanks

  • @SunilVishwakarma-r1m
    @SunilVishwakarma-r1m 10 หลายเดือนก่อน +3

    slight modification in code at 24:51 is---- (titanic.groupby('Pclass').mean('Survived')['Survived']*100).plot(kind='bar')

    • @SunilVishwakarma-r1m
      @SunilVishwakarma-r1m 10 หลายเดือนก่อน

      (titanic.groupby('Sex').mean('Survived')['Survived']*100)

    • @SunilVishwakarma-r1m
      @SunilVishwakarma-r1m 10 หลายเดือนก่อน +1

      (titanic.groupby('Embarked').mean('Survived')['Survived']*100)

    • @shashankarora2945
      @shashankarora2945 หลายเดือนก่อน

      Thanks a lot man

  • @riyazsk7656
    @riyazsk7656 7 หลายเดือนก่อน

    how to know which pair/tuples should be selected for the analysis

  • @mujeebrahman5282
    @mujeebrahman5282 ปีที่แล้ว +1

    In scatter plot, where did you get df from? it should have been tips in hue, style and size.

    • @Findritwik
      @Findritwik 13 วันที่ผ่านมา

      Right

  • @heetbhatt4511
    @heetbhatt4511 ปีที่แล้ว

    thank you

  • @SACHINKUMAR-px8kq
    @SACHINKUMAR-px8kq ปีที่แล้ว

    Thankyou so much Sir

  • @lavupadhyay
    @lavupadhyay 3 หลายเดือนก่อน

    awesome , 0 to HERO

  • @vishnujatav6329
    @vishnujatav6329 2 ปีที่แล้ว

    Thank you very much sir. you are great

  • @lakshityagi684
    @lakshityagi684 2 ปีที่แล้ว

    Pretty nice content. Thankyou!

  • @10arsh51
    @10arsh51 ปีที่แล้ว +3

    25:17
    The Boyz 😂

  • @minalgupta7456
    @minalgupta7456 ปีที่แล้ว

    I am a big fan of you

  • @tusarmundhra5560
    @tusarmundhra5560 11 หลายเดือนก่อน

    awesome

  • @goyanii
    @goyanii ปีที่แล้ว +1

    free me premium quailty lactures
    thank you sir

  • @Garrick645
    @Garrick645 6 หลายเดือนก่อน +2

    19:18 why aren't the probabilities of dying and surviving not adding up to 1 ? My mind can't understand this fallacy. Koi samjaho please 😢😢

    • @sawankumar7628
      @sawankumar7628 14 วันที่ผ่านมา

      coz that probability of survial in class 1,2,3 . they have no relation. so if survival probability is 0.6 in pclass1 then p(died) = 0.4

  • @Gurpreetkaur-oj7kb
    @Gurpreetkaur-oj7kb 2 ปีที่แล้ว

    amazing video...

  • @yogeshhajare8234
    @yogeshhajare8234 2 ปีที่แล้ว

    thanks alot brother

  • @acharjyaarijit
    @acharjyaarijit ปีที่แล้ว +2

    bande uhape ultakgaye sare... nice sir..😀😀

  • @karanparashar6824
    @karanparashar6824 6 หลายเดือนก่อน +2

    Didn't know that it is possible to load data using the seaborn library.

    • @001_chandrikasarkar7
      @001_chandrikasarkar7 2 หลายเดือนก่อน

      lol same

    • @indra-zd9zu
      @indra-zd9zu 2 หลายเดือนก่อน

      😂😂😂​@@001_chandrikasarkar7

    • @indra-zd9zu
      @indra-zd9zu 2 หลายเดือนก่อน

      You cant load all dataset.you can load only inbuit dataset

  • @minalgupta7456
    @minalgupta7456 ปีที่แล้ว

    I like ur videos

  • @rivupangas2735
    @rivupangas2735 2 ปีที่แล้ว +1

    At 17:46 we can use this code:
    sns.kdeplot(x='Age' ,data=titanic, hue='Survived')

  • @AbdurRahman-lv9ec
    @AbdurRahman-lv9ec ปีที่แล้ว

    great

  • @ajaykushwaha-je6mw
    @ajaykushwaha-je6mw 2 ปีที่แล้ว

    I have one doubt,
    Survive have two value 0 and 1.
    titanic.groupby['Pclass'].mean()
    how to know whether this give information survived passenger or dead passenger.

    • @mukeshnayak7984
      @mukeshnayak7984 2 ปีที่แล้ว

      same doubt

    • @mukeshnayak7984
      @mukeshnayak7984 2 ปีที่แล้ว

      have u found the ans ?

    • @nikhiliyer8436
      @nikhiliyer8436 2 ปีที่แล้ว +1

      Survived

    • @aarindey
      @aarindey ปีที่แล้ว

      0->Dead 1->Survived
      So, the mean will give Survived

    • @ruhisharma2857
      @ruhisharma2857 3 หลายเดือนก่อน

      titanic.groupby['Pclass'].mean()['Survived']

  • @calvinfernandez1956
    @calvinfernandez1956 2 ปีที่แล้ว +3

    Hey guys, an update on Seaborn. There is now a 'Future Warning' when ever you run the function 'distplot' saying that it will be discontinued in the future. So I did a little research and found a suitable replacement to it on stack overflow
    sns.histplot(x =titanic[titanic['Survived']==0]['Age'],kde=True,stat='density',bins = 50). You wont be able to turn off hist tho.

  • @akashmanojchoudhary3290
    @akashmanojchoudhary3290 2 ปีที่แล้ว

    how to plot too many categorical values in seaborn, for eg- I've 150 diseases in diagnosis column. How to plot it?

    • @akashmanojchoudhary3290
      @akashmanojchoudhary3290 2 ปีที่แล้ว

      can anyone help me with this?

    • @ajaykushwaha-je6mw
      @ajaykushwaha-je6mw 2 ปีที่แล้ว

      @@akashmanojchoudhary3290 df[diagnosis].value_counts.plot(kind='"bar") or sns.countplot(df['diagnosis'],hue=df['label_column']) or sns.countplot(df['diagnosis'])

  • @highflyer30
    @highflyer30 ปีที่แล้ว

    load dataset not working tried everything updating python,notebook what to do

  • @sharangkulkarni1759
    @sharangkulkarni1759 ปีที่แล้ว +1

    guru

  • @Zovi-kanu
    @Zovi-kanu ปีที่แล้ว

    plz tell how to download csv file that use in this vedio

  • @AneeqMir
    @AneeqMir 4 หลายเดือนก่อน +1

    slight modification in code 7:45
    sns.scatterplot(x=tips['total_bill'], y=tips['tip'],hue=tips['sex'],style=tips['smoker'],size=tips['size'])
    plt.show()

  • @ClubLalpur
    @ClubLalpur ปีที่แล้ว

    barplot() takes from 0 to 1 positional arguments but 2 were given sir ye error a rha hai

    • @ajaykuchhadiya5812
      @ajaykuchhadiya5812 ปีที่แล้ว

      this is bcz the seaborn libraby is updated now , you can check the seaborn documentation and understand that plotting function

    • @Engineer884
      @Engineer884 9 หลายเดือนก่อน

      sns.barplot(x=titanic['Pclass'],y=titanic['Age'])

  • @123arskas
    @123arskas 2 ปีที่แล้ว

    8:11 You're using sex, smoker and size of someother dataset. It should be of tips but you've written df.

  • @YashGaneriwal-je6rh
    @YashGaneriwal-je6rh 7 วันที่ผ่านมา

    done

  • @krishnakanthmacherla4431
    @krishnakanthmacherla4431 2 ปีที่แล้ว

    Done

  • @Star-xk5jp
    @Star-xk5jp 9 หลายเดือนก่อน

    Day2-
    date:10/1/24

  • @faizahmed8015
    @faizahmed8015 ปีที่แล้ว +1

    6:59 Now one thing I analyze girl are stingy because scatterplot proved...😅😂

  • @shahrukh3531
    @shahrukh3531 ปีที่แล้ว

    Hindi sunkr, better feel hota h 😅

  • @prithvigupta8215
    @prithvigupta8215 2 ปีที่แล้ว

    28:41

  • @anantsrivastava5567
    @anantsrivastava5567 9 หลายเดือนก่อน

    date 11 jan 2024
    day 21

  • @adnan8bb805
    @adnan8bb805 7 หลายเดือนก่อน

    25:17, "clearly dikh raha hai ki female ko bachaya gaya, aur bande ludhak gae saare "🤣🤣🤣🤣🤣🤣🤣

  • @tempmail6469
    @tempmail6469 5 หลายเดือนก่อน

    Bande bahot ludak gye was personal hahahaahaha

  • @mukteshsingh8370
    @mukteshsingh8370 29 วันที่ผ่านมา

    Day-22
    Done

  • @highflyer30
    @highflyer30 ปีที่แล้ว +1

    not able to load dataset pls help
    tips=sns.load_dataset("tips") not working

    • @prathamsaboo
      @prathamsaboo 9 หลายเดือนก่อน

      Have you got the solution?

    • @Engineer884
      @Engineer884 9 หลายเดือนก่อน

      I was also facing issue with loading flights and iris, try loading it multiple times , you'll get it

    • @prathamsaboo
      @prathamsaboo 9 หลายเดือนก่อน

      @@Engineer884 I have the solution, I was just asking if he needs it now.

  • @adityakulkarni371
    @adityakulkarni371 ปีที่แล้ว

    sns.scatterplot(tips['total_bill'],tips['tip'],hue=df['sex'],style=df['smoker'],size=df['size'])
    sir shouldn't the smokers/size wala dataset be tips. you have written df. im confused here

    • @vengeance9898
      @vengeance9898 ปีที่แล้ว

      I don't know but may be he used seaborn instead of pandas to load the data

    • @Engineer884
      @Engineer884 9 หลายเดือนก่อน

      tips hi likhna chahiye tha

  • @MRAgundli
    @MRAgundli 5 หลายเดือนก่อน

    done