7-End To End Advanced RAG Project using Open Source LLM Models And Groq Inferencing engine

แชร์
ฝัง
  • เผยแพร่เมื่อ 15 ก.ย. 2024

ความคิดเห็น • 56

  • @krishnaik06
    @krishnaik06  5 หลายเดือนก่อน +6

    Support me by joining membership so that I can upload these kind of videos
    th-cam.com/channels/NU_lfiiWBdtULKOw6X0Dig.htmljoin

    • @dr8544
      @dr8544 5 หลายเดือนก่อน

      make a patreon

    • @r1ckmav
      @r1ckmav 5 หลายเดือนก่อน +1

      Just became member of this amazing channel.

  • @avixek
    @avixek 5 หลายเดือนก่อน +4

    I am using these series to learn langchain and deploy it in our fortune 10 company.. One of the key challenges in knowledge retrieval for all of the engineers in our team. I ran this scenario and we may have a savings of $500K/per yr. Please keep doing what you are doing.

    • @EkNidhi
      @EkNidhi 4 หลายเดือนก่อน

      Error initializing FAISS index: Error raised by inference endpoint: HTTPConnectionPool(host='localhost', port=11434): Max retries exceeded with url: /api/embeddings (Caused by NewConnectionError(': Failed to establish a new connection: [WinError 10061] No connection could be made because the target machine actively refused it'))
      can you solve this error?

    • @theshubhagrwl
      @theshubhagrwl 3 หลายเดือนก่อน

      Consider supporting the creator with 1% of the saving

    • @Santosh-xx4vf
      @Santosh-xx4vf 19 วันที่ผ่านมา

      Reply just for fun, take it like a joke
      If you support with 1% of income
      Than max you will support 50 people in life ie 50% of your income
      And ull go starving soon 🤣
      As other 50% goes a taxes to govt, by direct or indirect means 🤣

    • @Santosh-xx4vf
      @Santosh-xx4vf 19 วันที่ผ่านมา

      On a serious note.
      krish sir, is doing a great job for all of us we should support him in the ways possible

  • @DoomsdayDatabase
    @DoomsdayDatabase 5 หลายเดือนก่อน +3

    Can't wait till Groq introduces option for running almost any HuggingFace models! Never came across such a simple, fast and cost effective endpoint setup!

  • @nishantchoudhary3245
    @nishantchoudhary3245 5 หลายเดือนก่อน +3

    Best langchain series by best teacher. Krish sir ❤

  • @r1ckmav
    @r1ckmav 5 หลายเดือนก่อน

    Hi Krish, Thanks a lot for such an amazing content. You are doing a great help to humanity by publishing such an amazing content available free for everyone.

  • @canyouvish
    @canyouvish 5 หลายเดือนก่อน

    Very helpful set of videos. And yes, when I type words that have 'ng' in them - the 'g' almost always come before 'n'.

  • @shalabhchaturvedi6290
    @shalabhchaturvedi6290 5 หลายเดือนก่อน +1

    Krish, you are doing an excellent job! Great job, bro!

  • @maazidris4435
    @maazidris4435 5 หลายเดือนก่อน

    Great work sir, Like from Pakistan

  • @DavidHelmen-sb9wf
    @DavidHelmen-sb9wf 5 หลายเดือนก่อน +2

    Hey Krish I hope you are doing well, can you make a video about full stack data scientist AKA Unicorn data scientist role?

  • @varshavaran2558
    @varshavaran2558 5 หลายเดือนก่อน +1

    Sir, the latest advancements in AI and data science trigger anxiousness since I am in early stages of Data science of roadmap. Will I ever catch-up with the latest technology or the basics remain relevant still

    • @ankaleshganorkar
      @ankaleshganorkar 5 หลายเดือนก่อน

      yes, tools will always change, domain knowledge will remain, enjoy the anxiousness.

  • @rabbanimogal1786
    @rabbanimogal1786 5 หลายเดือนก่อน +1

    Great work!!

  • @theshubhagrwl
    @theshubhagrwl 3 หลายเดือนก่อน

    This seriese a gem 💎

  • @andrespineiro7609
    @andrespineiro7609 5 หลายเดือนก่อน

    You are the best, dude!

  • @r1ckmav
    @r1ckmav 4 หลายเดือนก่อน

    Hi Krish, I just tried replacing the WebBaseLoader to PyPDFLoader somehow the same code piece does not seem to be working. Any suggestions to how to replace the WebBaseLoader with PyPDFLoader?

  • @TarabUTK
    @TarabUTK 3 หลายเดือนก่อน

    out of all the ollama models:
    Llama 3 8B 4.7GB ollama run llama3
    Llama 3 70B 40GB ollama run llama3:70b
    Phi-3 3.8B 2.3GB ollama run phi3
    Mistral 7B 4.1GB ollama run mistral
    Neural Chat 7B 4.1GB ollama run neural-chat
    Starling 7B 4.1GB ollama run starling-lm
    Code Llama 7B 3.8GB ollama run codellama
    Llama 2 Uncensored 7B 3.8GB ollama run llama2-uncensored
    LLaVA 7B 4.5GB ollama run llava
    Gemma 2B 1.4GB ollama run gemma:2b
    Gemma 7B 4.8GB ollama run gemma:7b
    Solar 10.7B 6.1GB ollama run solar
    on a 16 GB RAM 'ok' desktop, Phi-3, Gemma-2b seems to run in reasonable time .... but I could not get Groq to work with either. Please advise what changes are needed for this part of the series. As of now, wait time is too long.
    Thanks

  • @dharmendersingh7565
    @dharmendersingh7565 5 หลายเดือนก่อน +1

    Great work, but make a video on implementing RAG on complex pdf (like extracting financial statements tables)

  • @YorkYongYeo
    @YorkYongYeo 4 หลายเดือนก่อน

    Will it be possible to process the vector embeddings before hand and allow the app to run faster in terms of reply?

  • @EkNidhi
    @EkNidhi 4 หลายเดือนก่อน +1

    Error initializing FAISS index: Error raised by inference endpoint: HTTPConnectionPool(host='localhost', port=11434): Max retries exceeded with url: /api/embeddings (Caused by NewConnectionError(': Failed to establish a new connection: [WinError 10061] No connection could be made because the target machine actively refused it'))
    i m getting this error why?

    • @aiml.meetsolanki
      @aiml.meetsolanki 4 หลายเดือนก่อน

      i got the same error check your .env file paths of keys it is not given properly

    • @samagrashrivastava8042
      @samagrashrivastava8042 4 หลายเดือนก่อน

      @@aiml.meetsolanki I got the same error! can you explain the solution.

    • @aiml.meetsolanki
      @aiml.meetsolanki 4 หลายเดือนก่อน

      @@samagrashrivastava8042problem with api key initialisation. It is not given properly.initialise it properly

  • @shayanCodingMaster
    @shayanCodingMaster 5 หลายเดือนก่อน +1

    Nice 🙂

  • @mohsenghafari7652
    @mohsenghafari7652 4 หลายเดือนก่อน

    Hi dear friend .
    Thank you for your efforts .
    How to use this tutorial in PDFs at other language (for example Persian )
    What will the subject ?
    I made many efforts and tested different models, but the results in asking questions about pdfs are not good and accurate!
    Thank you for the explanation

  • @afnankhan1278
    @afnankhan1278 หลายเดือนก่อน

    we used sessions, but the process looks similare to last streamlit app we created nothing different you said you will explain it

  • @adityavipradas3252
    @adityavipradas3252 4 หลายเดือนก่อน

    Is Groq LPU hardware needed to see the actual inference performance boost?

  • @mithunshet5922
    @mithunshet5922 5 หลายเดือนก่อน

    Hi.. I am interested in predictive analytics where I mainly use ML models.. How will LLM be useful in this field?

  • @tootemakan
    @tootemakan 5 หลายเดือนก่อน

    Please build a conversational chain system using open source llms

  • @_itsvinay
    @_itsvinay 5 หลายเดือนก่อน

    Hi @krishnaik06 pls make a video on how to connect it with cloud database like pinecone or astra db. After version update it's not working with langchain.

  • @NairNitinvenugopal
    @NairNitinvenugopal 3 หลายเดือนก่อน

    instead of chains, can we use agent here?

  • @michelle_theodore
    @michelle_theodore 2 หลายเดือนก่อน

    I swearrrrr same issues with me too i press c before g and it always turns out to be lancghain

  • @chinnibngrm272
    @chinnibngrm272 5 หลายเดือนก่อน

    Sir want to build chatbot for Fintuned llama2 model in my local system
    Is it possible to build with streamlit like ur projects
    Please give us solution for this 😊😊

  • @mohamedkeddache4202
    @mohamedkeddache4202 3 หลายเดือนก่อน

    what is the purpose of using open source LLMs with paid groq api.
    just use directly openAi api key
    the only purpose of free LLMs are the ability to run them locally fro free

  • @captionjunior6959
    @captionjunior6959 4 หลายเดือนก่อน

    how to develop a plagrism checker?

  • @shankar9063
    @shankar9063 4 หลายเดือนก่อน

    llm=ChatGroq(groq_api_key=groq_api_key,
    model_name="mixtral-8x7b-32768")
    I initialized the mixtral but i 'am getting the following error.
    ValueError: Error raised by inference API HTTP code: 404, {"error":"model 'llama2' not found, try pulling it first"}

    • @aiml.meetsolanki
      @aiml.meetsolanki 4 หลายเดือนก่อน

      install llama2 by "ollama run llama2"

  • @amritsubramanian8384
    @amritsubramanian8384 4 หลายเดือนก่อน

    awesomeee ;)

  • @sarveshudapurkar6235
    @sarveshudapurkar6235 5 หลายเดือนก่อน

    SIr I'm getting some error
    ValueError: Error raised by inference API HTTP code: 404, {"error":"model 'llama2' not found, try pulling it first"}

    • @harikiranm5756
      @harikiranm5756 4 หลายเดือนก่อน

      Were you able to figure this out?

    • @aiml_44_sourikpoddar49
      @aiml_44_sourikpoddar49 4 หลายเดือนก่อน

      Solution?

    • @aiml.meetsolanki
      @aiml.meetsolanki 4 หลายเดือนก่อน

      install llama2 by "ollama run llama2"

    • @aviratsharma771
      @aviratsharma771 3 หลายเดือนก่อน

      i am getting same error in every project from this playlist. do you get the solution??

    • @aiml.meetsolanki
      @aiml.meetsolanki 3 หลายเดือนก่อน

      @@aviratsharma771 install Ollama in your pc then run "Ollama run llama2" in Command Prompt

  • @ramdasvk0716
    @ramdasvk0716 5 หลายเดือนก่อน +1

    Open source is 🫶🫶🫶

  • @sivanthik8288
    @sivanthik8288 5 หลายเดือนก่อน

    Thanks!