Implement BERT From Scratch - PyTorch

แชร์
ฝัง
  • เผยแพร่เมื่อ 27 ต.ค. 2024

ความคิดเห็น • 22

  • @nhatnguyenviet8083
    @nhatnguyenviet8083 ปีที่แล้ว +3

    Great, I hope that will be more "from Scratch" like this. Thanks very much!

    • @uygarkurtai
      @uygarkurtai  ปีที่แล้ว

      there will be! thank you :)

  • @goktankurnaz
    @goktankurnaz ปีที่แล้ว +2

    Great video with great explanations!

  • @islevkurt1532
    @islevkurt1532 ปีที่แล้ว +1

    This is great for me👍🏻
    Thank you🙏🏻

  • @learntestenglish
    @learntestenglish ปีที่แล้ว

    I want to learn about this topic but haven't been able find good resources. This is great for me. Thanks 🙏🙏

  • @user-wr4yl7tx3w
    @user-wr4yl7tx3w ปีที่แล้ว

    this is really helpful. thanks!

  • @Ece-kx6qk
    @Ece-kx6qk ปีที่แล้ว +1

    Çok faydalı bir video olmuş teşekkürler

  • @thomasfathy4769
    @thomasfathy4769 6 หลายเดือนก่อน

    you are genius brooo 🤩🤩🤩

    • @uygarkurtai
      @uygarkurtai  6 หลายเดือนก่อน

      Thank you!

  • @cartoonsondemand_
    @cartoonsondemand_ 10 หลายเดือนก่อน

    please make a video on implementing gpt2 using pytorch

    • @uygarkurtai
      @uygarkurtai  10 หลายเดือนก่อน +1

      I'll try to. Thank you for recommendation!

  • @wilfredomartel7781
    @wilfredomartel7781 7 หลายเดือนก่อน

    😊 does this new implementation include flash attention?

    • @uygarkurtai
      @uygarkurtai  7 หลายเดือนก่อน

      Hey, this is just the vanilla implementation. However I believe you can enable flash attention while loading the model. I suggest you check huggingface documentation.

  • @TheAnistop007
    @TheAnistop007 ปีที่แล้ว

    Hello ! great video thanks ! Is there a code where is model is trained ? like with loss and optimizer ?

    • @uygarkurtai
      @uygarkurtai  ปีที่แล้ว +1

      Hi thank you :) I only did the model for this. Maybe I do the full training in the future. If you want to try however I can give a tip. Train a BERT as usual (from huggingface maybe). Instead of importing it from a library, use this model. It should work.