Automated Data Labeling Using Florence-2

แชร์
ฝัง
  • เผยแพร่เมื่อ 16 ต.ค. 2024
  • Florence-2, a novel vision foundation model with a unified, prompt-based representation for a variety of computer vision and vision-language tasks.
    GitHub: github.com/Aar...
    Try out the Florence-2 model here: huggingface.co....
    Paper: arxiv.org/pdf/...
    Florence-2 is pre-trained on our FLD-5B dataset encompassing a total of 5.4B comprehensive annotations across 126M images.
    #computervision #largelanguagemodels #languagemodels #microsoft #ai #artificialintelligence

ความคิดเห็น • 19

  • @mohammadyahya78
    @mohammadyahya78 3 หลายเดือนก่อน +1

    Amazing as usual. Been watching you for over a year

  • @pandian1537
    @pandian1537 2 หลายเดือนก่อน +1

    We need to train Florence-2 model ocr task for custom dataset is it possible train without affecting the performance of the model so can you give some idea about this?

    • @CodeWithAarohi
      @CodeWithAarohi  2 หลายเดือนก่อน

      Yes, you can fine tune the model on your custom dataset. I can't say anything about "affecting the performance" Try to use good quality and good quantity of data then model performance will not decrease.

    • @pandian1537
      @pandian1537 หลายเดือนก่อน

      TQ so much for your reply

  • @rajmeetsingh1625
    @rajmeetsingh1625 3 หลายเดือนก่อน +1

    Thanks for sharing. Any video related to the custom dataset using VLM ....

  • @abhishekpawar921
    @abhishekpawar921 3 หลายเดือนก่อน

    Good examples. Nicely done👏🏻

  • @billzoaiken
    @billzoaiken 3 หลายเดือนก่อน

    Any chance you'll be doing a demo for fine-tuning? In the next couple of weeks, I'll definitely be doing some fine-tuning for custom tasks (i.e., given this image and a prompt, determine whatever), but I'm not particularly familiar with DocVQA's format, which is what the HuggingFace article uses. I would greatly appreciate a high-level overview and options in the meantime, if you have the time. Thanks for this though!

    • @CodeWithAarohi
      @CodeWithAarohi  3 หลายเดือนก่อน +1

      @@billzoaiken Yes, I will make a video in day or 2. Working on it :)

    • @billzoaiken
      @billzoaiken 3 หลายเดือนก่อน

      @@CodeWithAarohi Fantastic! Your videos always serve as a great jumping-off point. Thank you!

  • @dineshkumare1750
    @dineshkumare1750 18 วันที่ผ่านมา

    how it is compared to qwen-vl ?

  • @NakulMali-j6d
    @NakulMali-j6d 3 หลายเดือนก่อน +1

    Hell mam Thanks for your all videos and efforts. I am following your channel, but I request you please upload one detail video on how to finetune Yolov5 model for custome images classification.

  • @aneerimmco
    @aneerimmco 3 หลายเดือนก่อน

    helpful information

    • @CodeWithAarohi
      @CodeWithAarohi  3 หลายเดือนก่อน

      Glad it was helpful!

  • @karimcherhabil8788
    @karimcherhabil8788 3 หลายเดือนก่อน

    Can you explain Vision mamba