What is Retrieval-Augmented Generation (RAG)?

แชร์
ฝัง
  • เผยแพร่เมื่อ 8 พ.ค. 2024
  • Try RAG with watsonx → ibm.biz/BdMsRT
    Learn more about RAG→ ibm.biz/BdMsRt
    Large language models usually give great answers, but because they're limited to the training data used to create the model. Over time they can become incomplete--or worse, generate answers that are just plain wrong. One way of improving the LLM results is called "retrieval-augmented generation" or RAG. In this video, IBM Senior Research Scientist Marina Danilevsky explains the LLM/RAG framework and how this combination delivers two big advantages, namely: the model gets the most up-to-date and trustworthy facts, and you can see where the model got its info, lending more credibility to what it generates.
    Get started for free on IBM Cloud → ibm.biz/sign-up-now
    Subscribe to see more videos like this in the future → ibm.biz/subscribe-now

ความคิดเห็น • 357

  • @xzskywalkersun515
    @xzskywalkersun515 5 หลายเดือนก่อน +444

    This lecturer should be given credit for such an amazing explanation.

    • @cosmicscattering5499
      @cosmicscattering5499 3 หลายเดือนก่อน +3

      I was thinking the same, she explained this so clearly.

    • @tariqmking
      @tariqmking หลายเดือนก่อน +1

      Yes this was excellently explained, kudos to her.

    • @brianmi40
      @brianmi40 หลายเดือนก่อน +6

      Or at least credit for being able to write backwards!

    • @victoriamilhoan512
      @victoriamilhoan512 วันที่ผ่านมา

      The connection between a human answering a question in real life vs how LLMs (with or without RAG) do it was so helpful!

  • @vt1454
    @vt1454 6 หลายเดือนก่อน +297

    IBM should start a learning platform. Their videos are so good.

    • @XEQUTE
      @XEQUTE 5 หลายเดือนก่อน +6

      i think they already do

    • @srinivasreddyt9555
      @srinivasreddyt9555 หลายเดือนก่อน

      Yes, they have it already. TH-cam.

    • @siddheshpgaikwad
      @siddheshpgaikwad 20 วันที่ผ่านมา +1

      Its mirrored video, she wrote naturally and video was mirrored later

    • @Hossam_Ahmed_
      @Hossam_Ahmed_ 19 วันที่ผ่านมา

      They have skill build but not videos at least most of the content

    • @CaptPicard81
      @CaptPicard81 17 วันที่ผ่านมา

      They do, I recently attended a week long AI workshop based on an IBM curriculum

  • @jordonkash
    @jordonkash 2 หลายเดือนก่อน +28

    4:15 Marina combines the colors of the word prompt to emphasis her point. Nice touch

  • @ghtgillen
    @ghtgillen 7 หลายเดือนก่อน +42

    Your ability to write backwards on the glass is amazing! ;-)

    • @jsonbourne8122
      @jsonbourne8122 6 หลายเดือนก่อน +19

      They flip the video

    • @Paul-rs4gd
      @Paul-rs4gd 3 หลายเดือนก่อน +6

      @@jsonbourne8122 So obvious, but I did not think of it. My idea was way more complicated!

  • @ericadar
    @ericadar 5 หลายเดือนก่อน +48

    Marina is a talented teacher. This was brief, clear and enjoyable.

  • @vikramn2190
    @vikramn2190 7 หลายเดือนก่อน +30

    I believe the video is slightly inaccurate. As one of the commenters mentioned, the LLM is frozen and the act of interfacing with external sources and vector datastores is not carried out by the LLM.
    The following is the actual flow:
    Step 1: User makes a prompt
    Step 2: Prompt is converted to a vector embedding
    Step 3: Nearby documents in vector space are selected
    Step 4: Prompt is sent along with selected documents as context
    Step 5: LLM responds with given context
    Please correct me if I'm wrong.

    • @DJ-lo8qj
      @DJ-lo8qj 20 วันที่ผ่านมา

      I’m not sure. Looking at OpenAI documentation on RAG, they have a similar flow as demonstrated in this video. I think the retrieval of external data is considered to be part of the LLM (at least per OpenAI)

    • @PlaytimeEntertainment
      @PlaytimeEntertainment 18 วันที่ผ่านมา

      I do not think retrieval is part of LLM. LLM is the best model at the end of convergence after training. It can't be modified rather after LLM response you can always use that info for next flow of retrieval

  • @TheAllnun21
    @TheAllnun21 5 หลายเดือนก่อน +16

    Wow, this is the best beginner's introduction I've seen on RAG!

  • @maruthuk
    @maruthuk 7 หลายเดือนก่อน +18

    Loved the simple example to describe how RAG can be used to augment the responses of LLM models.

  • @m.kaschi2741
    @m.kaschi2741 5 หลายเดือนก่อน +5

    Wow, I opened youtube coming from the ibm blog just to leave a comment. Clearly explained, very good example, and well presented as well!! :) Thank you

  • @Lucildor
    @Lucildor 3 หลายเดือนก่อน

    Please keep all these videos coming! They are so easy to understand and straightforward. Muchas gracias!

  • @aam50
    @aam50 5 หลายเดือนก่อน +16

    That's a really great explanation of RAG in terms most people will understand. I was also sufficiently fascinated by how the writing on glass was done to go hunt down the answer from other comments!

  • @GregSolon
    @GregSolon 2 หลายเดือนก่อน

    One of the easiest to understand RAG explanations I've seen - thanks.

  • @ReflectionOcean
    @ReflectionOcean 5 หลายเดือนก่อน +21

    1. Understanding the challenges with LLMs - 0:36
    2. Introducing Retrieval-Augmented Generation (RAG) to solve LLM issues - 0:18
    3. Using RAG to provide accurate, up-to-date information - 1:26
    4. Demonstrating how RAG uses a content store to improve responses - 3:02
    5. Explaining the three-part prompt in the RAG framework - 4:13
    6. Addressing how RAG keeps LLMs current without retraining - 4:38
    7. Highlighting the use of primary sources to prevent data hallucination - 5:02
    8. Discussing the importance of improving both the retriever and the generative model - 6:01

  • @ntoscano01
    @ntoscano01 3 หลายเดือนก่อน +21

    Very well explained!!! Thank you for your explanation of this. I’m so tired of 45 minute TH-cam videos with a college educated professional trying to explain ML topics. If you can’t explain a topic in your own language in 10 minutes or less than you have failed to either understand it yourself or communicate effectively.

  • @geopopos
    @geopopos หลายเดือนก่อน +39

    I love seeing a large company like IBM invest in educating the public with free content! You all rock!

  • @paulaenchina
    @paulaenchina 3 หลายเดือนก่อน +1

    This is the best explanation I have seen so far for RAG! Amazing content!

  • @jyhherng
    @jyhherng 6 หลายเดือนก่อน +5

    this let's me understand why the embeddings used to generate the vectorstore is a different set from the embeddings of the LLM... Thanks, Marina!

  • @past_life_project
    @past_life_project 3 หลายเดือนก่อน

    I have watched many IBM videos and this is the undoubtedly the best ! I will be searching for your videos now Marina!

  • @projectfocrin
    @projectfocrin 5 หลายเดือนก่อน +5

    Great explanation. Even the pros in the field I have never seen explain like this.

  • @kingvanessa946
    @kingvanessa946 3 หลายเดือนก่อน +1

    For me, this is the most easy-to-understand video to explain RAG!

  • @rujmah
    @rujmah 2 หลายเดือนก่อน

    Brilliant explanation and illustration. Thanks for your hard work putting this presentation together.

  • @hamidapremani6151
    @hamidapremani6151 2 หลายเดือนก่อน

    The explanation was spot on!
    IBM is the go to platform to learn about new technology with their high quality content explained and illustrated with so much simplicity.

  • @444Yielding
    @444Yielding 19 วันที่ผ่านมา +3

    This video is highly underviewed for as informative as it is!

  • @francischacko3627
    @francischacko3627 16 วันที่ผ่านมา

    perfect explanation understood every bit , no lags kept it very interesting ,amazing job

  • @rvssrkrishna2
    @rvssrkrishna2 2 หลายเดือนก่อน

    Very precise and exact information on RAG in a nutshell. Thank you for saving my time.

  • @TheMsksk
    @TheMsksk 8 หลายเดือนก่อน

    Great video as always. Thanks for sharing.

  • @evaiintelligence
    @evaiintelligence 20 วันที่ผ่านมา

    Marina has done a great job explaining LLM and RAGs in simple terms.

  • @redwinsh258
    @redwinsh258 6 หลายเดือนก่อน +21

    The interesting part is not retrieval from the internet, but retrieval from long term memory, and with a stated objective that builds on such long term memory, and continually gives it "maintenance" so it's efficient and effective to answer. LLMs are awesome because even though there are many challenges ahead, they sort of give us a hint of what's possible, without them it would be hard to have the motivation to follow the road

  • @Shailendrashail
    @Shailendrashail 8 หลายเดือนก่อน +1

    Good Explanation of RAG. Thanks for sharing.

  • @vnaykmar7
    @vnaykmar7 5 หลายเดือนก่อน +2

    Such an amazing explanation. Thank you ma'am!

  • @Anubis2828
    @Anubis2828 2 หลายเดือนก่อน

    Great, simple, quick explanation

  • @HimalayJoriwal
    @HimalayJoriwal 2 หลายเดือนก่อน

    Best explanation so far from all the content on internet.

  • @bdouglas
    @bdouglas หลายเดือนก่อน

    That was excellent, simple, and elegant! Thank you!

  • @toenytv7946
    @toenytv7946 2 หลายเดือนก่อน +1

    Great down the rabbit hole video. Very deep and understandable. IBM academy worthy in my opinion.

  • @rafa1rafa
    @rafa1rafa 5 หลายเดือนก่อน +2

    Great explanation! The video was very didactic, congratulations!

  • @kunalsoni7681
    @kunalsoni7681 6 หลายเดือนก่อน

    Thanks for letting us know about this feature of LLM :)

  • @sawyerburnett8319
    @sawyerburnett8319 3 หลายเดือนก่อน +1

    Wow, having a lightbulb moment finally after hearing this mentioned so often. Makes more sense now!

  • @javi_park
    @javi_park 3 หลายเดือนก่อน +28

    hold up - the fact that the board is flipped is the most underrated modern education marvel nobody's talking about

    • @RiaKeenan
      @RiaKeenan 3 หลายเดือนก่อน

      I know, right?!

    • @euseikodak
      @euseikodak 3 หลายเดือนก่อน +4

      Probably they filmed it in front of a glass board and flipped the video on edition later on

    • @politicallyincorrect1705
      @politicallyincorrect1705 2 หลายเดือนก่อน

      Filmed in front of a non-reflective mirror.

    • @TheTomtz
      @TheTomtz หลายเดือนก่อน

      Just simply write on a glass board ,record it from the other side and laterally flip the image! Simple aa that.. and pls dont distract people from the contents being lectured by thinkin about the process behind the rec🤣

    • @thewallstreetjournal5675
      @thewallstreetjournal5675 หลายเดือนก่อน

      Is the board fliped or has she been flipped?

  • @mstarlingc
    @mstarlingc 5 หลายเดือนก่อน +1

    Pretty simple explanation, thank you

  • @PaulGrew-wl7mh
    @PaulGrew-wl7mh หลายเดือนก่อน

    An amazing explanation that made RAG understandable in about 4:23 minutes!

  • @preciousrose2715
    @preciousrose2715 22 วันที่ผ่านมา

    This was such an amazing explanation!

  • @Aryankingz
    @Aryankingz 6 หลายเดือนก่อน +3

    That's what Knowledge graphs are for, to keep LLMs grounded with a reliable source and up-to-date.

  • @ashwinkumar675
    @ashwinkumar675 15 วันที่ผ่านมา

    This is so well explained! Thank you 👍🏻✅

  • @xdevs23
    @xdevs23 หลายเดือนก่อน +5

    The entire video I've been wondering how they made the transparent whiteboard

  • @rockochamp
    @rockochamp 5 หลายเดือนก่อน +1

    very well executed presentation.
    i had to think twice about how you can write in reverse but then i RAGed my system 2 :)

  • @mohamadhijazi3895
    @mohamadhijazi3895 28 วันที่ผ่านมา

    The video is short and consice yet the delivery is very elegant. She might be the best instructor that have teached me. Any idea how the video was created?

  • @alexiojunior7867
    @alexiojunior7867 26 วันที่ผ่านมา

    wow this was an amazing Explanation ,very easy to understand

  • @gaemrpaterso-ri2jd
    @gaemrpaterso-ri2jd 8 หลายเดือนก่อน

    Great video, you guys should do one on promising tech industries

  • @user-im6ub3sf6m
    @user-im6ub3sf6m 3 หลายเดือนก่อน

    Great explanation with an example. Thank you

  • @zuzukouzina-original
    @zuzukouzina-original 3 หลายเดือนก่อน

    Very clear explanation, much respect 🫡

  • @aniket_mishr
    @aniket_mishr หลายเดือนก่อน

    The explanation was very good 💯.

  • @JasonVonHolmes
    @JasonVonHolmes หลายเดือนก่อน

    This was explained fantastically.

  • @deltawhiplash1614
    @deltawhiplash1614 5 วันที่ผ่านมา

    This is a really good video thank you for sharing this knowledge

  • @MraM23
    @MraM23 3 หลายเดือนก่อน

    Great lessons! Nice of you to step out 🙃 and make such engaging and educative content This is a very useful in helping us in critical thinking. Thank you for sharing this video. 👍
    Current ai models may impose neurotypical norms and expectations based on current data trained on . 🤔
    Curious to see more on how IBM approach the challenges and limitations of Ai

  • @Kekko400D
    @Kekko400D 3 หลายเดือนก่อน

    Fantastic explanation, proud to be an IBMer

  • @user-hk5dk9rb6p
    @user-hk5dk9rb6p 3 หลายเดือนก่อน +1

    Fantastic video and explanation. Thank you!

  • @afshinkarimi2382
    @afshinkarimi2382 8 หลายเดือนก่อน

    Great video. Thanks for sharing

  • @thomasbrowne6649
    @thomasbrowne6649 หลายเดือนก่อน

    This is excellent and I hope IBM does well in this space. We need a reliable, non-hype vendor.

  • @prasannakulkarni5664
    @prasannakulkarni5664 28 วันที่ผ่านมา

    the color coding on your whiteboard is really apt here !

  • @eddisonlewis8099
    @eddisonlewis8099 3 หลายเดือนก่อน

    AWESOME EXPLANATION OF THE CONCEPT RAG

  • @laurentpastorelli1354
    @laurentpastorelli1354 4 หลายเดือนก่อน +1

    Super good and clear, well done!

  • @oieieio741
    @oieieio741 5 หลายเดือนก่อน

    Very Helpful! Great explanation. thx IBM

  • @user-cd6hp5kc1n
    @user-cd6hp5kc1n 7 หลายเดือนก่อน +16

    The ability to write backwards, much less cursive writing backwards, is very impressive!

    • @IBMTechnology
      @IBMTechnology  7 หลายเดือนก่อน +7

      See ibm.biz/write-backwards

    • @jsonbourne8122
      @jsonbourne8122 6 หลายเดือนก่อน

      Left hand too!

    • @NishanSaliya
      @NishanSaliya 5 หลายเดือนก่อน

      @@IBMTechnology Thanks .... I was reading comments to check for an answer for that question!

  • @421sap
    @421sap 5 หลายเดือนก่อน

    Thank you, Marina Danilevsky ....

  • @khalidelgazzar
    @khalidelgazzar 5 หลายเดือนก่อน +2

    Great explanation. Thank you!😊

  • @AntenorTeixeira
    @AntenorTeixeira 4 หลายเดือนก่อน

    That's the best video about RAG that I've watched

  • @ericmcnally5128
    @ericmcnally5128 2 หลายเดือนก่อน

    This is a fantastic lesson video.

  • @star2k279
    @star2k279 4 หลายเดือนก่อน +1

    Thank you for such a great explanation.

  • @shashankshekharsingh9336
    @shashankshekharsingh9336 9 วันที่ผ่านมา

    very good and clear explanation

  • @siddharth4251
    @siddharth4251 หลายเดือนก่อน

    Amazing explanation, finally i understand it.

  • @AdarshKumar-kx2cn
    @AdarshKumar-kx2cn 2 หลายเดือนก่อน

    Beautifully explained....thanks

  • @lauther_27
    @lauther_27 5 หลายเดือนก่อน +1

    Amazing video, thanks IBM ❤

  • @johnmccullough7084
    @johnmccullough7084 6 หลายเดือนก่อน +1

    Appreciate the succinct explanation. 👍

  • @user-bo1kv5zy3w
    @user-bo1kv5zy3w 6 หลายเดือนก่อน

    Awesome explanation. Love you.

  • @sudhakarveeraraghavan5832
    @sudhakarveeraraghavan5832 28 วันที่ผ่านมา

    Very well explained and it is easily understandable to non AI person as well. Thanks.

  • @kallamamran
    @kallamamran 4 หลายเดือนก่อน +2

    We also need the models to cross check their own answers with the sources of information before printing out the answer to the user. There is no self control today. Models just say things. "I don't know" is actually a perfectly fine answer sometimes!

  • @rahulberry4806
    @rahulberry4806 12 วันที่ผ่านมา

    thanks for the great explanation

  • @Junglytics
    @Junglytics 3 หลายเดือนก่อน

    Great video, excellent explanation!

  • @janhorak8799
    @janhorak8799 2 หลายเดือนก่อน +9

    Did all the speakers have to learn how to write in a mirrored way or is this effect reached by some digital trick?

    • @VlogBySKSK
      @VlogBySKSK 24 วันที่ผ่านมา

      There is a digital mirroring technique which is used to show the content this way...

    • @mao-tse-tung
      @mao-tse-tung 16 วันที่ผ่านมา +1

      She was right handed before the mirror effect

  • @terencelewis4985
    @terencelewis4985 3 หลายเดือนก่อน

    Excellent explanation!

  • @AC-xd7sw
    @AC-xd7sw 4 หลายเดือนก่อน

    Insightful, please more video like this

  • @stanislavzayarsky
    @stanislavzayarsky 3 หลายเดือนก่อน

    Finally, we got a clear explanation!

  • @sk-6032
    @sk-6032 วันที่ผ่านมา

    Very well explained 🙏🏼👍

  • @sumedhaj9017
    @sumedhaj9017 2 หลายเดือนก่อน

    Amazing explanation! Thank you:)

  • @user-xf4vm2gf6g
    @user-xf4vm2gf6g 3 หลายเดือนก่อน

    Excellent ! thank you for sharing this knowledge !

  • @randomforest_dev
    @randomforest_dev 20 วันที่ผ่านมา

    Very good explanation!

  • @sprintwithcarlos
    @sprintwithcarlos 5 หลายเดือนก่อน

    Great explanation!

  • @BooleanDisorder
    @BooleanDisorder 5 หลายเดือนก่อน +1

    Thank you for these videos. Makes it much easier to nagivate this new AI-ra of machine learning.

  • @katsunoi
    @katsunoi 5 หลายเดือนก่อน

    nice video - great explanation!

  • @yashkhorania3726
    @yashkhorania3726 7 วันที่ผ่านมา

    very nicely explained

  • @ayanSaha13291
    @ayanSaha13291 20 วันที่ผ่านมา

    Great video! thanks for educating!

  • @MarshallMelnychuk
    @MarshallMelnychuk 7 หลายเดือนก่อน +9

    Thank you Marina, very helpful and informative video. One question I have is; how do you make these videos like this? Being able to on a screen facing the camera, this is great. What's your secret?

    • @PeterCooperUK
      @PeterCooperUK 7 หลายเดือนก่อน +10

      Sometimes these are done on transparent "whiteboards" and the video is then flipped horizontally.

    • @ChristopherSmithGPlus
      @ChristopherSmithGPlus 7 หลายเดือนก่อน

      th-cam.com/video/eVOPDQ5KYso/w-d-xo.htmlsi=LADnROL0SF33Hg54

    • @IBMTechnology
      @IBMTechnology  7 หลายเดือนก่อน +15

      See ibm.biz/write-backwards

    • @lowkeyproducktvt2101
      @lowkeyproducktvt2101 6 หลายเดือนก่อน +1

      @@IBMTechnology okay now i get it !!!

    • @rayuduaddagarla3857
      @rayuduaddagarla3857 6 หลายเดือนก่อน +3

      IBM should hire left hand writers so it will right handed after flip 😊

  • @sharingmatters
    @sharingmatters 2 หลายเดือนก่อน

    Well explained!

  • @carvalhoribeiro
    @carvalhoribeiro หลายเดือนก่อน

    Amazing work. Thanks for sharing this.

  • @berkeokur99
    @berkeokur99 5 หลายเดือนก่อน

    Love the neon markers, also the content of course

  • @shinemuphy
    @shinemuphy 5 หลายเดือนก่อน

    Excellent explanation. thx

  • @kevinmulligan2006
    @kevinmulligan2006 หลายเดือนก่อน

    tokens as a [word] is what I'm working on right now (solo, self learning LLM techniques), this video helped me realize how the model doesn't know what it's outputting obviously, but AI-AI is different, so building tokens that have dimensional vectors that process in a separate model, can be used for explainable AI.

    • @kevinmulligan2006
      @kevinmulligan2006 หลายเดือนก่อน

      meaning a separate model processes the response itself, meta, it's for building evolution learning. AI-AI machine learning, you need a way to configure in between the iterations.

  • @user-uk9mt4ue6w
    @user-uk9mt4ue6w 4 หลายเดือนก่อน +1

    Все толково, четко и понятно. Респект автору.

  • @mohammadsubhan1318
    @mohammadsubhan1318 3 หลายเดือนก่อน

    Nicely explained 👍

  • @zhanezar
    @zhanezar หลายเดือนก่อน

    BRILLIANT VIDEO thank you!