Get your own custom Phi-3-mini for your use cases

แชร์
ฝัง
  • เผยแพร่เมื่อ 21 ก.ย. 2024

ความคิดเห็น • 27

  • @jpmottin
    @jpmottin 4 หลายเดือนก่อน +4

    Simple, straight to the point

  • @metanulski
    @metanulski 4 หลายเดือนก่อน +16

    Hi. I still do not unterstand how I can create my own datasets. Can you make a video about that? Its in the title "on you own dataset" ;-)

    • @sherpya
      @sherpya 4 หลายเดือนก่อน +1

      if you don't know you may not need it 😂, a dataset is mainly a series of question / answers pairs

    • @onlineinformation5320
      @onlineinformation5320 4 หลายเดือนก่อน

      @@sherpya I have a csv of question answer pairs how should I upload it plzzz answer

    • @marilynlucas5128
      @marilynlucas5128 4 หลายเดือนก่อน

      Use DSPy. Don't worry about creating your own datasets. It's a rabbit hole you'll never get out of.

    • @sherpya
      @sherpya 4 หลายเดือนก่อน

      @@onlineinformation5320 the are some video tutorials, you mainly format them as json lines or whatever, since you neee to read them tipically in a notebook

    • @d4138
      @d4138 4 หลายเดือนก่อน

      Why do you suggest DSPy? Do you have experience with it, @marilynlucas5128

  • @hadebeh2588
    @hadebeh2588 4 หลายเดือนก่อน +3

    In the code, the EOS_TOKEN is added „…, output) + EOS_TOKEN“, right? Is that all that is necessary or do I have to add the EOS_TOKEN into the dataset? I trained the model using the code you used but with my own data and my result-model never stops talking. 😢

  • @marilynlucas5128
    @marilynlucas5128 4 หลายเดือนก่อน +2

    Can HF auto-train be used here? Also, why does every keep insisting on fine-tuning when DSPy is already out? You can obtain structured outputs with DSPy without the need to fine-tune. You haven't focused much on DSPy, I think it's very important you do this. It's clearly the future of AI

    • @engineerprompt
      @engineerprompt  4 หลายเดือนก่อน +1

      You can use auto-train. UnSloth gives you more efficient finetuning (memory). DSPy is on my list. Need to get a better understanding of it and will start creating content on it.

  • @khaledbouzaiene3959
    @khaledbouzaiene3959 3 หลายเดือนก่อน

    but if my data inculte like dailogue how can be structured where there is one instruction for each response

  • @VerdonTrigance
    @VerdonTrigance 4 หลายเดือนก่อน +3

    Thank you man for your videos. But my most curious question is how to prepare dataset from my own data? I have a book and wanna talk with book. Obviously RAG cannot fit all the content of the book even with 128k context length. So how to train my model on that book?

    • @himansrivastava
      @himansrivastava 4 หลายเดือนก่อน

      I have the same doubt. A video on this would be very helpful.

    • @CharlesOkwuagwu
      @CharlesOkwuagwu 4 หลายเดือนก่อน

      I second that.

    • @marilynlucas5128
      @marilynlucas5128 4 หลายเดือนก่อน

      huh!? Rag is your best bet! If you want structured outputs to enable easy and efficient state transitions, use DSPy.

    • @engineerprompt
      @engineerprompt  4 หลายเดือนก่อน +5

      Will see what I can do here.

  • @huuhuynguyen3025
    @huuhuynguyen3025 4 หลายเดือนก่อน +1

    Is it possible to finetune on my language?

  • @HeATx07_
    @HeATx07_ 29 วันที่ผ่านมา

    for my use case the dataset only consist of input and response , is it possible to fine tune !?

    • @engineerprompt
      @engineerprompt  29 วันที่ผ่านมา

      Yes, you can modify the prompt template in any capacity you want

  • @SukeshShetty1
    @SukeshShetty1 4 หลายเดือนก่อน

    How do I create a docker image and run it as a service? Can it support concurrent requests?

  • @amventures1
    @amventures1 2 หลายเดือนก่อน

    If I use Groq API, it's no longer opensource.

  • @superfliping
    @superfliping 4 หลายเดือนก่อน

    Whats next, show your skills?
    1. CodeCraft Duel: Super Agent Showdown
    2. Pixel Pioneers: Super Agent AI Clash
    3. Digital Duel: LLM Super Agents Battle
    4. Byte Battle Royale: Dueling LLM Agents
    5. AI Code Clash: Super Agent Showdown
    6. CodeCraft Combat: Super Agent Edition
    7. Digital Duel: Super Agent AI Battle
    8. Pixel Pioneers: LLM Super Agent Showdown
    9. Byte Battle Royale: Super Agent AI Combat
    10. AI Code Clash: Dueling Super Agents Edition

  • @onlineinformation5320
    @onlineinformation5320 4 หลายเดือนก่อน +1

    I have a csv of question answer pairs how should I upload it plzzz answer

    • @engineerprompt
      @engineerprompt  4 หลายเดือนก่อน

      You can read that csv file and convert it into a dictionary and the same code provided in the notebook.

  • @Khser
    @Khser 2 หลายเดือนก่อน

    why do so many "use your own dataset" videos are just using online datasets? this has nothing to do with my data, it is custom yes, but not mine. it is online dataset from hf. my dataset wouldnt be there

    • @ajil2766
      @ajil2766 2 หลายเดือนก่อน

      wrong 🤦‍♂️