🔥🚀 Inferencing on Mistral 7B LLM with 4-bit quantization 🚀 - In FREE Google Colab

แชร์
ฝัง
  • เผยแพร่เมื่อ 31 ม.ค. 2025

ความคิดเห็น • 28

  • @MasterBrain182
    @MasterBrain182 ปีที่แล้ว

    Astonishing content Man 🔥🔥🔥 🚀

  • @MihneaStefanUngurenau
    @MihneaStefanUngurenau 9 หลายเดือนก่อน

    Nice video, good job!

    • @RohanPaul-AI
      @RohanPaul-AI  9 หลายเดือนก่อน

      Thank you! Cheers!

  • @Mai-sq5cc
    @Mai-sq5cc ปีที่แล้ว +1

    thanks for tutorial!!

  • @javiergimenezmoya86
    @javiergimenezmoya86 ปีที่แล้ว +1

    What is better quantify with "bitsandbytes" o do it with "cllama" GUFF? What is the difference?

  • @venkateshr6127
    @venkateshr6127 ปีที่แล้ว +2

    Great video , can you make video on finetuning llm with best method.

    • @RohanPaul-AI
      @RohanPaul-AI  ปีที่แล้ว +2

      That's exactly whats planned Venkatesh. stay tuned..

  • @manueljan2117
    @manueljan2117 ปีที่แล้ว +1

    how to use your model in the lagchain agent? I used this but it says llm value is not a valid dict
    agent = initialize_agent(tools,
    model,
    agent="zero-shot-react-description",
    verbose=True,
    handle_parsing_errors=True,
    max_new_tokens=1000)

  • @samketola919
    @samketola919 ปีที่แล้ว +1

    thx 😀

  • @JavMend
    @JavMend 6 หลายเดือนก่อน

    hi, is there a simple change that can be made to the code to run inference in 8-bit?

  • @anuvratshukla7061
    @anuvratshukla7061 ปีที่แล้ว +2

    Can you make video how to use open source LLM to query structured databse (sql/pandas) for chat

    • @RohanPaul-AI
      @RohanPaul-AI  ปีที่แล้ว +2

      Sure will try to do one.

  • @gazzalifahim
    @gazzalifahim 8 หลายเดือนก่อน

    Hello there, this is exactly what I was looking for. Could you please give resources or any tutorial where details of those functions are discussed?
    My teammate gave a Kaggle Notebook with the exact same code and I am continuing to make that a conversational chatbot. But since I am brand new to this, I feel lost now.

  • @saravanajogan1221
    @saravanajogan1221 ปีที่แล้ว

    Hi Sir,
    Could you tell us the mic setup and how you make your videos with such clear qulaity. Thanks

  • @jamalabidalrahem8144
    @jamalabidalrahem8144 หลายเดือนก่อน

    can i use the minstral7b sharded model as a chatbot, so i can ask it questions about specific data i have for example, a book?

  • @mikiyasfikadu6422
    @mikiyasfikadu6422 ปีที่แล้ว

    Help full video

  • @LaylaBitar-z7z
    @LaylaBitar-z7z ปีที่แล้ว

    great video, sweet and simple. However, how can we control the token max limit, and also, do we have the option of separating our messages into a system message and a user message just like in Openai?

  • @stabilitylabs
    @stabilitylabs ปีที่แล้ว +3

    thanks for your tutorial. I have question, how to generate output to 32k ?

  • @thehkmalhotra9714
    @thehkmalhotra9714 ปีที่แล้ว

    Loved your content buddy ❤. Can we keep this Google Colab instance keep running for free and how can we expose this model as an Rest API to use in hosted projects and that too not locally.

  • @tomasgarcia2420
    @tomasgarcia2420 6 หลายเดือนก่อน

    Hi, I get my token from huggingface but I dont know where I have to put it in colab

  • @vinsmokearifka
    @vinsmokearifka ปีที่แล้ว

    Sir, any advice if I use japanese or chinese language for RAG? Thanks

  • @MrunalAshwinbhaiMania-b1d
    @MrunalAshwinbhaiMania-b1d 9 หลายเดือนก่อน

    Can we do this type of qunatization with any model?

    • @RohanPaul-AI
      @RohanPaul-AI  9 หลายเดือนก่อน

      yes we can do very much. Checkout my tweet on this
      twitter.com/rohanpaul_ai/status/1765688184753820073

  • @onesecondnanba
    @onesecondnanba ปีที่แล้ว +1

    colab file not found pls give notebook link

    • @RohanPaul-AI
      @RohanPaul-AI  ปีที่แล้ว +1

      Corrected the link in the description, here it is
      github.com/rohan-paul/LLM-FineTuning-Large-Language-Models/blob/main/Mistral-7B-Inferencing.ipynb

  • @onesecondnanba
    @onesecondnanba ปีที่แล้ว +1

    how to fine tune this

    • @RohanPaul-AI
      @RohanPaul-AI  ปีที่แล้ว +1

      For finetuning checkout this video
      th-cam.com/video/6DGYj1EEWOw/w-d-xo.html&ab_channel=Rohan-Paul-AI