Gradient Descent Explained

แชร์
ฝัง
  • เผยแพร่เมื่อ 26 ก.ย. 2024

ความคิดเห็น • 28

  • @Msyoutube38
    @Msyoutube38 ปีที่แล้ว +9

    Very nice explanation of the concept, brief and understandable. Awesome!

  • @davidrempel433
    @davidrempel433 ปีที่แล้ว +26

    The most confusing part of this video is how he managed to write everything backwards on the glass so flawlessly

    • @sanataeeb969
      @sanataeeb969 ปีที่แล้ว +6

      can't they write on their normal side then flip the video?

    • @sirpsychosexy
      @sirpsychosexy ปีที่แล้ว +2

      @@sanataeeb969 no that would be way too easy

    • @waliyudin86
      @waliyudin86 ปีที่แล้ว +6

      Bro just focus on the gradient descent topic

    • @P4INKiller
      @P4INKiller 11 หลายเดือนก่อน

      @@sanataeeb969Oh shit, you're clever.

    • @smritibasnet9782
      @smritibasnet9782 หลายเดือนก่อน

      Nope he isnt writing backward..you can observe he seems to be using left hand to write ,but in actual right hand was being used

  • @vt1454
    @vt1454 2 ปีที่แล้ว +12

    As always, great video from IBM

    • @John-wx3zn
      @John-wx3zn 6 หลายเดือนก่อน

      It is wrong.

  • @Shrimant-ub4ul
    @Shrimant-ub4ul 3 หลายเดือนก่อน

    Thank You Martin , really helpful for my uni exam

  • @krishnakeshav23
    @krishnakeshav23 ปีที่แล้ว +2

    Good explanation. It is somewhat also important to note that curve should be differentiable.

  • @sotirismoschos775
    @sotirismoschos775 ปีที่แล้ว +4

    didn't know Steve Kerr works at IBM

  • @krissatish87
    @krissatish87 6 หลายเดือนก่อน

    The best video i could find. Thank you.

  • @barnamehnevisilearn
    @barnamehnevisilearn 3 วันที่ผ่านมา

    Let me clarify the concept of learning rate and step size in gradient descent:
    Learning rate:
    The learning rate is a hyperparameter that we set before starting the optimization process. It's a fixed value that determines how large our steps will be in general.
    Step size:
    The actual size of each step is determined by both the learning rate and the gradient at that point. Specifically:
    step_size = learning_rate * magnitude_of_gradient
    So:
    The learning rate itself is not the size of the steps from point to point.
    The learning rate is a constant that helps determine how big those steps will be.
    The actual size of each step can vary, even with a constant learning rate, because it also depends on the gradient at each point.
    To visualize this:
    In steep areas of the loss function (large gradient), the steps will be larger.
    In flatter areas (small gradient), the steps will be smaller.
    The learning rate acts as a general "scaling factor" for all these steps.

  • @hugaexpl0it
    @hugaexpl0it ปีที่แล้ว +1

    Very good explanation of high-level concept on GD.

  • @FaberLSH
    @FaberLSH 2 หลายเดือนก่อน

    Thank you so much!

  • @handsanitizer2457
    @handsanitizer2457 ปีที่แล้ว

    Wow best explanation ever 👏

  • @harshsonar9346
    @harshsonar9346 10 หลายเดือนก่อน +1

    Im always confused by these screens or boards, whatever.
    Like how do you write on them? Do you have to write backwards or do you write normally and it kinda mirrors it?

  • @s.m.rakibhasan5525
    @s.m.rakibhasan5525 ปีที่แล้ว

    great lecture

  • @_alekss
    @_alekss ปีที่แล้ว +1

    Nice I learned more from this 7 min video than 1 hour long boring lecture

  • @John-wx3zn
    @John-wx3zn 6 หลายเดือนก่อน +2

    Your neural network is wrong.

    • @slimeminem7402
      @slimeminem7402 25 วันที่ผ่านมา

      Yeah the neurons are not fully connected 1:43

  • @Justme-dk7vm
    @Justme-dk7vm 5 หลายเดือนก่อน +1

    ANY CHANCE TO GIVE 1000 LIKES???😩

  • @velo1337
    @velo1337 2 ปีที่แล้ว

    ibm: "how to make a neural network for the stock market?"

  • @Rajivrocks-Ltd.
    @Rajivrocks-Ltd. ปีที่แล้ว

    I was expecting a mathematical explanation :(

  • @abdulhamidabdullahimagama9334
    @abdulhamidabdullahimagama9334 2 ปีที่แล้ว

    I couldn't visualise, I saw nothing on the screen...

    • @yt-sh
      @yt-sh 2 ปีที่แล้ว

      can see it

  • @Theodorus5
    @Theodorus5 หลายเดือนก่อน

    Too many words