Hierarchical Cluster Analysis [Simply explained]

แชร์
ฝัง
  • เผยแพร่เมื่อ 23 พ.ค. 2024
  • What is Hierarchical Cluster Analysis? And how is it calculated?
    A hierarchical cluster analysis is a clustering method that creates a hierarchical tree of objects to be clustered (Dendrogram). The tree represents the relationships between the objects and shows how the objects are clustered at different levels.
    ► Load sample data set
    datatab.net/statistics-calcul...
    ► Online Calculator Hierarchical Cluster Analysis
    datatab.net/statistics-calcul...
    ► Hierarchical Cluster Analysis Tutorial
    datatab.net/tutorial/hierarch...
    ► E-BOOK
    datatab.net/statistics-book
    00:00 What is Hierarchical Cluster Analysis?
    00:31 Example of Hierarchical Cluster Analysis
    00:50 Calculate hierarchical cluster analysis
    06:32 Calculate hierarchical cluster analysis online

ความคิดเห็น • 50

  • @4chanFootballMemes
    @4chanFootballMemes 3 หลายเดือนก่อน +12

    I loved learning about "Heyrakikal" clustering

  • @odiakaolika5715
    @odiakaolika5715 2 หลายเดือนก่อน +7

    You just made my evening with your simple explanation.

    • @datatab
      @datatab  2 หลายเดือนก่อน

      Glad it was helpful and many thanks for your feedback! Regards Hannah

  • @ozgurogur1297
    @ozgurogur1297 ปีที่แล้ว +2

    I found it very understandable and simple. thanks a lot!

  • @alexfrancois
    @alexfrancois 11 หลายเดือนก่อน +1

    Beautifully explained, thanks! 🙏 Incredibly clear.

  • @masteroftheworld001
    @masteroftheworld001 9 หลายเดือนก่อน

    well explained thank you so much

  • @shawnkim6287
    @shawnkim6287 8 หลายเดือนก่อน

    thank you so much. you clarified a lot!!!!
    😀

  • @nakirambau7632
    @nakirambau7632 6 หลายเดือนก่อน +2

    thank you so much, you have explained it so well

    • @datatab
      @datatab  6 หลายเดือนก่อน +1

      Glad it was helpful!

  • @manuelleitner3196
    @manuelleitner3196 ปีที่แล้ว +2

    Great video, thank you!!!

    • @datatab
      @datatab  ปีที่แล้ว

      My pleasure!

  • @saurabhjoshi3010
    @saurabhjoshi3010 5 หลายเดือนก่อน

    nicely explained

  • @matheusdelima1743
    @matheusdelima1743 ปีที่แล้ว +1

    Great content. I'm a fan :)

    • @datatab
      @datatab  ปีที่แล้ว +1

      Glad it was helpful and many thanks for your nice feedback! Regards Hannah

    • @iqraahmad130
      @iqraahmad130 ปีที่แล้ว

      youre kinda cute

  • @ibrahimabubakarzango9803
    @ibrahimabubakarzango9803 2 หลายเดือนก่อน +1

    Pls endeavour to avoid making mistakes thanks for comment section i could have got it so difficult to comprehend. That aspect of sqrt of 17 is terrible. But u did well and this video is good too

    • @datatab
      @datatab  2 หลายเดือนก่อน

      Hi thanks for youre feedback! We try to avoid mistakes, sorry for that and for the resulting trouble! Regards, Hannah

    • @Oladayo1
      @Oladayo1 หลายเดือนก่อน

      well, that's because it's the sqrt of 10 not sqrt of 17. The mistake was using 4 instead of 3

  • @rodidoesburg4061
    @rodidoesburg4061 4 หลายเดือนก่อน

    How do you name the clusters? Just from left to right, so cluster 1, cluster 2, cluster 3. Or are there more methods to name a cluster?

  • @ricardorivashernandez4023
    @ricardorivashernandez4023 8 หลายเดือนก่อน

    Real good!

  • @osmancetinkaya8930
    @osmancetinkaya8930 ปีที่แล้ว +7

    How might be the sqr of 17 (16+1) =equal to 3,162 ? it must be 4,123 is not?

    • @manuelruelas3496
      @manuelruelas3496 8 หลายเดือนก่อน +3

      The error is that the x distance is 3 (from 1 to 4) not 4, so it’s the sq root of 10.

  • @samuraixyz22
    @samuraixyz22 ปีที่แล้ว +2

    I would like to TH-cam tutorials like this. Do you have recommendations on what softwares to use?

    • @datatab
      @datatab  ปีที่แล้ว

      DATAtab : )

    • @samuraixyz22
      @samuraixyz22 ปีที่แล้ว

      @DATAtab where can you learn more about it?

  • @rileyharper7679
    @rileyharper7679 6 หลายเดือนก่อน +3

    The Euclidean distance horizontal component at 2:17 should be 3 not 4 since 4 - 1 = 3. Also, the manhattan distance should be 4 and the maximum distance should be 3 for the same reason.

    • @playbros332
      @playbros332 5 หลายเดือนก่อน +1

      I agree they are wrong, but shouldn't it be square root of 17, which is 4.12?

    • @fabianr9394
      @fabianr9394 5 หลายเดือนก่อน

      Because you go 3 steps to the right and 1 up; so sqrt(3^2 + 1^2)​@@playbros332

  • @luisamar8214
    @luisamar8214 17 วันที่ผ่านมา

    How you calculate the distances between Lisa, Joe with the others?? you have a group of positions not just one... how do you do that? thankss!

    • @datatab
      @datatab  17 วันที่ผ่านมา

      Hi, in this case you would first calcualte the center between Lisa and Joe and then the diestance from this center to one other Person. Regards Hannah

  • @nazhifmuh.kasyfan2148
    @nazhifmuh.kasyfan2148 หลายเดือนก่อน +1

    I would like to ask, is Hierarchical Cluster Analysis always associated with the Euclidean Distance? Thank you

    • @datatab
      @datatab  หลายเดือนก่อน

      Hi many thanks for your question, Hierarchical Cluster Analysis (HCA) is not always associated with the Euclidean distance. While Euclidean distance is commonly used, HCA can work with various distance metrics depending on the nature of the data and the analysis goals.
      Here are some common distance metrics used in HCA:
      - Euclidean Distance: This is the straight-line distance between two points in a multi-dimensional space. It's one of the simplest and most widely used distance metrics.
      - Manhattan Distance (also known as City Block or L1 distance): This is the sum of absolute differences between coordinates. It can be suitable when diagonal movement isn't meaningful.
      - Cosine Similarity: This measures the cosine of the angle between two vectors, commonly used in text analysis and other contexts where vector magnitude might vary.
      - Mahalanobis Distance: It accounts for correlations in data by incorporating the covariance matrix, making it suitable for data with different scales and correlations among variables.
      - Minkowski Distance: A generalization of Euclidean and Manhattan distances, with a parameter 'p' to control the degree of the norm.
      - Correlation-based Distance: This distance uses the correlation between data points rather than absolute differences. It's common in gene expression analysis or other contexts where relationships between variables matter more than absolute values.
      I hope this was helpful : ) Regards Hannah

  • @python4ncert202
    @python4ncert202 ปีที่แล้ว

    Nice video!
    I want to know the name of algorithm that you have used here to explain hierarchical clustering.

    • @Nothingimportant1
      @Nothingimportant1 ปีที่แล้ว

      I want too, but it is hight probable that she does not tell us. Statistics saying.

    • @muhammadwaseem_
      @muhammadwaseem_ ปีที่แล้ว

      @@Nothingimportant1 AGNES

  • @maxwellspyk494
    @maxwellspyk494 ปีที่แล้ว +1

    hi where can i find the elbo method

    • @datatab
      @datatab  ปีที่แล้ว

      Oh sorry, it will be there soon!!!

  • @fredh3152
    @fredh3152 19 วันที่ผ่านมา +1

    i love your accent

    • @datatab
      @datatab  18 วันที่ผ่านมา

      : )

  • @mahidahmed7
    @mahidahmed7 11 หลายเดือนก่อน +1

    klaaastarrrrss

  • @ahmad3823
    @ahmad3823 หลายเดือนก่อน +1

    4-1=3 though!

    • @datatab
      @datatab  หลายเดือนก่อน

      : )

  • @asrarbw
    @asrarbw 2 หลายเดือนก่อน

    Claaaastars 😂

  • @user-vo4ew1gx
    @user-vo4ew1gx ปีที่แล้ว +4

    Excellent explanation. Why it takes too long to create a new video?

    • @datatab
      @datatab  ปีที่แล้ว +2

      Good question! : ) We need almost two weeks to prepare the topic and to create the slides! Regards Hannah

    • @user-vo4ew1gx
      @user-vo4ew1gx ปีที่แล้ว

      @@datatab i hope it will be fast :)

  • @PaulKam1997
    @PaulKam1997 ปีที่แล้ว +1

    is and not und at 3:15

    • @datatab
      @datatab  ปีที่แล้ว

      Thanks : )

  • @abdulaziznazarov9661
    @abdulaziznazarov9661 3 หลายเดือนก่อน

    i think you have a mistakes with calculating