ML Interpretability: feature visualization, adversarial example, interp. for language models

แชร์
ฝัง
  • เผยแพร่เมื่อ 20 ก.ย. 2024
  • In this video, I will be introducing Machine Learning Interpretability, a vast topic that aims at understanding the inner mechanisms of how machine learning models make their predictions, with the aim of debugging them, making them more transparent and trustworthy.
    I will start by reviewing deep learning and the back-propagation algorithm, which are necessary for understanding adversarial example generation and feature visualization for computer vision classification models. In the second part, I will show how we can leverage the knowledge built in the first part of the video and apply it to language models. In particular, we will see how we can get insights on the bias of a language model by generating a prompt that maximizes the likelihood of the next token being a certain concept of our choice. This allows us to answer questions like:
    "What does my language model think of women?"
    "What does my language model think of minorities?"
    This video has been built in collaboration with Leap Labs - an AI research lab that deals with machine learning interpretability and built the Leap Labs Interpretability Engine, which allows to get insights on how computer vision models work and how to improve them by generating prototypes, isolating features and understanding entanglement between classes.
    Leap Labs: www.leap-labs....
    Leap Labs Tutorials: docs.leap-labs...
    As usual, the code and PDF slides are available at the following links:
    - PDF slides: github.com/hkp...
    - Adversarial Example Generation (tricking a classifier): github.com/hkp...
    - Generate inputs for language models: github.com/jes...

ความคิดเห็น • 43

  • @sauravrao234
    @sauravrao234 4 หลายเดือนก่อน +25

    You are one incredibly underrated youtuber

    • @denishclarke4470
      @denishclarke4470 4 หลายเดือนก่อน +1

      Agreed

    • @PongsiriHuang
      @PongsiriHuang 2 หลายเดือนก่อน +1

      yupppp, just found him few days ago. definitel underated.

    • @arpitanand4693
      @arpitanand4693 หลายเดือนก่อน +1

      And one hell of a teacher

  • @JatinKashyap-Innovision
    @JatinKashyap-Innovision 4 หลายเดือนก่อน +8

    Can't understand why this channel is free! Thanks a lot for all the content, keep it flowing.

  • @alivecoding4995
    @alivecoding4995 2 วันที่ผ่านมา +1

    I am very thankful for your qualitative content! 😊

  • @mosca204
    @mosca204 8 วันที่ผ่านมา +1

    One of the best videos on youtube. Please do IJEPA next. And keep on publishing videos and code.

  • @nmxnunezz8214
    @nmxnunezz8214 2 หลายเดือนก่อน +3

    andrej karpathy liked a tweet were some dude said your video on difussion models was incredibly underated, you are going to make it far!

  • @4thlord51
    @4thlord51 4 หลายเดือนก่อน +5

    You are a great teacher.

  • @Trending-lc6kc
    @Trending-lc6kc 4 หลายเดือนก่อน +1

    Bruh, I was just looking for this topic & got the notification of this video. Thanks dude

  • @Wing-sv6ps
    @Wing-sv6ps หลายเดือนก่อน +1

    Keep up the amazing work!

  • @jueying1443
    @jueying1443 3 หลายเดือนก่อน +1

    Thanks, could you talk about flash attention?

  • @hajaani6417
    @hajaani6417 4 หลายเดือนก่อน +1

    As always, I salute you for this awesome video, keep up the good work 👍

  • @DoppiaDx
    @DoppiaDx 4 หลายเดือนก่อน +1

    Always interesting topics. Thank you so much

  • @MENGRUWANG-qk1ip
    @MENGRUWANG-qk1ip 2 หลายเดือนก่อน

    Hello! I was wondering if the blogger might be interested in Microsoft's recently released Graph RAG algorithm. I'm hoping you could do a video explaining it; your explanations are always so excellent!

    • @umarjamilai
      @umarjamilai  2 หลายเดือนก่อน

      博主翻译错了😁我会考虑的

  • @RadRebel4
    @RadRebel4 4 หลายเดือนก่อน +1

    Amazing Video! Could you also include a traning script for the Video you made about the transformer model for general LLM task. As the earlier one was about translation only.

  • @oiooio7879
    @oiooio7879 3 หลายเดือนก่อน +1

    Thank you for this video!

  • @abhijitrai1349
    @abhijitrai1349 2 หลายเดือนก่อน

    How do you stay up to date on Data science research papers?

  • @ahmedmohamedabdelhameedabd295
    @ahmedmohamedabdelhameedabd295 4 หลายเดือนก่อน +1

    Amazing , interesting topic.

  • @agiagiagitk
    @agiagiagitk 4 หลายเดือนก่อน

    any plan for 'Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models' video? It'd be awesome with your explanation on the math ~.~

  • @mahyarkarami6572
    @mahyarkarami6572 4 หลายเดือนก่อน +1

    I thought for a moment that Satya is coming for explain ;)

    • @umarjamilai
      @umarjamilai  4 หลายเดือนก่อน +1

      🤓🤓🤓

  • @daleanfer7449
    @daleanfer7449 4 หลายเดือนก่อน +1

    great videos!

  • @Research_work02
    @Research_work02 4 หลายเดือนก่อน

    Thanks a lot for this! A request to add the training script to the Stable Diffusion repository, it would be of great help!! Thank you!

  • @AhmedMohamed-nh2hs
    @AhmedMohamed-nh2hs 3 หลายเดือนก่อน +1

    thank you for this!

  • @sonned9843
    @sonned9843 2 หลายเดือนก่อน +1

    God bless you, you are amazing

  • @johanvandermerwe7687
    @johanvandermerwe7687 3 หลายเดือนก่อน

    I tuoi video sono fantastici, benedizioni dal Sud Africa 🙌

    • @umarjamilai
      @umarjamilai  3 หลายเดือนก่อน

      Thank you very much for your support!

  • @Simplifieddeeplearning
    @Simplifieddeeplearning 3 หลายเดือนก่อน

    can you make tutorial video on model like Perplexity that use website live search

  • @justrax8466
    @justrax8466 4 หลายเดือนก่อน

    Please sir make a complete course for LLM engineering 😊

  • @Wenming.
    @Wenming. 3 หลายเดือนก่อน +1

    cool tutorial❤

  • @Simplifieddeeplearning
    @Simplifieddeeplearning 3 หลายเดือนก่อน

    hello sir can you please make a tutorial on pytorch to fellow along with your pytorch projects. Thank you in advance

  • @elieelezra2734
    @elieelezra2734 3 หลายเดือนก่อน +1

    Good vid boss

  • @usr-34-gambaman
    @usr-34-gambaman 2 หลายเดือนก่อน

    Does leap labs provide open-source libraries?

    • @umarjamilai
      @umarjamilai  2 หลายเดือนก่อน

      You can play with the LLM interpretability notebook, which is open source. Link in the description

  • @olympus8903
    @olympus8903 4 หลายเดือนก่อน

    It's Kind of architecture similar to Stable diffusion. Stable diffusion Generate the image from text. I am not saying exactly same, But kind of similar. Both generate image or features from noise.

  • @johanvandermerwe7687
    @johanvandermerwe7687 3 หลายเดือนก่อน

    Thanks

  • @bibhutibaibhavbora8770
    @bibhutibaibhavbora8770 3 หลายเดือนก่อน

    When the new video is coming?

  • @Wenming.
    @Wenming. 3 หลายเดือนก่อน

    谢谢!