Teacher-Student Neural Networks: The Secret to Supercharged AI

แชร์
ฝัง
  • เผยแพร่เมื่อ 21 ม.ค. 2025

ความคิดเห็น • 17

  • @jeromeeusebius
    @jeromeeusebius 10 หลายเดือนก่อน +3

    Thank you for sharing this video explaining Knowledge distillation, and describing how the cross-entropy loss (hard_target_loss) is combined with the distillation_loss using KLDiv, which compares the soft probabilities of the teacher and student model, using the parameter alpha. Thanks also for provding the sample code and walkthrough the code. The use of a simple and student models being the same network and seeing the same amount of data, but having different validation accuracies, does show that the student did indeed learnt "the dark knowledge" from the teacher model, much richer knowledge whcih we can see from the results: student accuracy being better that the simple model accuracy. Cheers.

    • @C4A
      @C4A  10 หลายเดือนก่อน

      Thank you for watching and commenting! Have a wonderful day.

  • @theelysium1597
    @theelysium1597 24 วันที่ผ่านมา

    Thank you very much for your explanation!
    Unrelated: In the best positive sense: I love your expressive eyebrows!

  • @imadsaddik
    @imadsaddik 6 หลายเดือนก่อน +1

    Man thank you, I loved the explanation

    • @C4A
      @C4A  6 หลายเดือนก่อน

      Glad to hear it! Thank you for watching and commenting.

  • @AshutoshKumar-cw8tw
    @AshutoshKumar-cw8tw 7 หลายเดือนก่อน +1

    Nice Explanation..Thanks :)

    • @C4A
      @C4A  7 หลายเดือนก่อน

      I am glad to hear that you liked it! Thank you for watching and commenting.

  • @sharma01ketan
    @sharma01ketan 9 หลายเดือนก่อน +2

    Thank you sir :)

    • @C4A
      @C4A  9 หลายเดือนก่อน

      You are welcome! Thank you for watching.

  • @LokeshB-l8o
    @LokeshB-l8o 10 หลายเดือนก่อน +1

    Here what is the name of Teacher and student model?

    • @C4A
      @C4A  10 หลายเดือนก่อน +1

      Thank you for watching. In the example code, both the Teacher and the Student models are examples of artificial neural network models.
      The key difference between these models is their complexity and intended role in the training process. The Teacher model is larger and more complex, intended to capture a deep understanding of the data. The Student model is simpler and aims to approximate the performance of the Teacher model while being more computationally efficient.

    • @LokeshB-l8o
      @LokeshB-l8o 10 หลายเดือนก่อน +1

      @@C4A Now i understand it because we are trying to do this knowledge distallation with two different model that why i asked you.Thank you

    • @C4A
      @C4A  10 หลายเดือนก่อน

      @@LokeshB-l8o You are most welcome!

  • @aminedahane5874
    @aminedahane5874 11 หลายเดือนก่อน +2

    Good job

    • @C4A
      @C4A  11 หลายเดือนก่อน

      Thank you!

  • @ankitghosh3865
    @ankitghosh3865 11 หลายเดือนก่อน +3

    i love you sir

    • @C4A
      @C4A  11 หลายเดือนก่อน

      Thank you for the kind words?