Reading DINO source code - DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection

แชร์
ฝัง
  • เผยแพร่เมื่อ 2 พ.ย. 2024

ความคิดเห็น • 8

  • @davidro00
    @davidro00 6 หลายเดือนก่อน +1

    Really looking forward to the grounding brother of this🦖

    • @makgaiduk
      @makgaiduk  5 หลายเดือนก่อน

      The grounding brother: th-cam.com/video/qV4LLNoEORo/w-d-xo.html

    • @davidro00
      @davidro00 5 หลายเดือนก่อน

      @@makgaiduk what a hustle man👏🏼

  • @jak-zee
    @jak-zee 6 หลายเดือนก่อน +2

    Thanks for the interactive explanation. I admire how you draw straight on your slides. Are you using an ipad? Can you share which tools you used to draw on your slides? Thanks.

    • @makgaiduk
      @makgaiduk  6 หลายเดือนก่อน +1

      I use MousePro: apps.apple.com/us/app/pro-mouse/id1505869474?mt=12
      4$ on App Store. It is really simple, but it does the trick

    • @jak-zee
      @jak-zee 6 หลายเดือนก่อน

      @@makgaiduk awesome thanks!

  • @tirthapanchal7468
    @tirthapanchal7468 6 หลายเดือนก่อน +1

    The code explanation is good. However, I had a question. "Which python files and its dependent modules are used from the github repository?" Its confusing considering there are various backbones considered Swin and ResNet for DINO DETR.

    • @makgaiduk
      @makgaiduk  6 หลายเดือนก่อน

      The video shows DINO-4 scale model with ResNet50 backbone: github.com/IDEA-Research/DINO/blob/main/config/DINO/DINO_4scale.py