Tensordroid
Tensordroid
  • 187
  • 75 217
Not all Attention is Needed in Transformers ?!
Paper Link: arxiv.org/abs/2406.15786
My Links 🔗
👉🏻 Subscribe: youtube.com/@Tensordroid
👉🏻 Twitter: vishesh_t27
👉🏻 LinkedIn: www.linkedin.com/in/vishesh-tripathi/
มุมมอง: 0

วีดีโอ

Understanding Cross Entropy and Perplexity
มุมมอง 3312 ชั่วโมงที่ผ่านมา
My Links 🔗 👉🏻 Subscribe: youtube.com/@Tensordroid 👉🏻 Twitter: vishesh_t27 👉🏻 LinkedIn: www.linkedin.com/in/vishesh-tripathi/
But what is Differential Transformer ?
มุมมอง 6519 ชั่วโมงที่ผ่านมา
Paper Link: arxiv.org/abs/2410.02703 My Links 🔗 👉🏻 Subscribe: youtube.com/@Tensordroid 👉🏻 Twitter: vishesh_t27 👉🏻 LinkedIn: www.linkedin.com/in/vishesh-tripathi/
But what is selective Attention ?
มุมมอง 33วันที่ผ่านมา
Hey guys, sorry for the horizontal view, was trying something and realised it during final editing. Paper link: arxiv.org/abs/2410.02703 My Links 🔗 👉🏻 Subscribe: youtube.com/@Tensordroid 👉🏻 Twitter: vishesh_t27 👉🏻 LinkedIn: www.linkedin.com/in/vishesh-tripathi/
Google presents Astute RAG !!
มุมมอง 14614 วันที่ผ่านมา
Paper Link: arxiv.org/abs/2410.07176 My Links 🔗 👉🏻 Subscribe: youtube.com/@Tensordroid 👉🏻 Twitter: vishesh_t27 👉🏻 LinkedIn: www.linkedin.com/in/vishesh-tripathi/
ColPali: Indexing Documents in RAG made easy using Vision Language Models !!
มุมมอง 18914 วันที่ผ่านมา
Paper Link: arxiv.org/abs/2407.01449 Blog: huggingface.co/blog/manu/colpali My Links 🔗 👉🏻 Subscribe: youtube.com/@Tensordroid 👉🏻 Twitter: vishesh_t27 👉🏻 LinkedIn: www.linkedin.com/in/vishesh-tripathi/
Best Paper for Retrieval Augmented Generation Pain Points !!
มุมมอง 85หลายเดือนก่อน
Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely: arxiv.org/pdf/2409.14924 Searching for Best Practices in Retrieval-Augmented Generation: arxiv.org/pdf/2407.01219 My Links 🔗 👉🏻 Subscribe: youtube.com/@Tensordroid 👉🏻 Twitter: vishesh_t27 👉🏻 LinkedIn: www.linkedin.com/in/vishesh-tripathi/
But OpenAI o1 is here !!
มุมมอง 260หลายเดือนก่อน
OpenAI o1: openai.com/index/learning-to-reason-with-llms/ My Links 🔗 👉🏻 Subscribe: youtube.com/@Tensordroid 👉🏻 Twitter: vishesh_t27 👉🏻 LinkedIn: www.linkedin.com/in/vishesh-tripathi/
Smart India Hackathon Guide 2024
มุมมอง 2062 หลายเดือนก่อน
Smart India Hackathon Website: www.sih.gov.in/ My Links 🔗 👉🏻 Subscribe: youtube.com/@Tensordroid 👉🏻 Twitter: vishesh_t27 👉🏻 LinkedIn: www.linkedin.com/in/vishesh-tripathi/
But what is DeepSpeed ? DeepSpeed vs VLLM
มุมมอง 1522 หลายเดือนก่อน
Research paper: arxiv.org/abs/2401.08671 My Links 🔗 👉🏻 Subscribe: youtube.com/@Tensordroid 👉🏻 Twitter: vishesh_t27 👉🏻 LinkedIn: www.linkedin.com/in/vishesh-tripathi/
Preparing for Machine Learning Interviews in 2024
มุมมอง 653 หลายเดือนก่อน
Are you gearing up for your first Machine Learning interview and wondering where to start? In this video, we'll guide you through the essential steps to ace your ML interview as a fresher. Whether you're just starting your journey or looking to refine your skills, this video covers everything you need to know. Unstop Mentorship: unstop.com/mentor/vishesh?ref=kzVULcm TopMate Mentorship: topmate....
But GPT-4o-mini is here !!
มุมมอง 373 หลายเดือนก่อน
GPT-4o-mini: openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/ Leaderboard: chat.lmsys.org/?leaderboard Post on X: x.com/lmsysorg/status/1813999088758673875 My Links 🔗 👉🏻 Subscribe: youtube.com/@Tensordroid 👉🏻 Twitter: vishesh_t27 👉🏻 LinkedIn: www.linkedin.com/in/vishesh-tripathi/
Weekly ML News Episode - 8
มุมมอง 423 หลายเดือนก่อน
AI API Analysis: artificialanalysis.ai/ Groq: Quickstart: console.groq.com/docs/quickstart Groqbook: github.com/Bklieger/groqbook GroqNotes: github.com/Bklieger/groqnotes Research Papers: Learning to (Learn at Test Time): RNNs with Expressive Hidden States: arxiv.org/abs/2407.04620 Searching for Best Practices in Retrieval-Augmented Generation: arxiv.org/pdf/2407.01219 RouteLLM: Learning to Rou...
Are Large Language Models really learning something or Not ?
มุมมอง 663 หลายเดือนก่อน
In this video, we dive into the paper "When Benchmarks are Targets: Revealing the Sensitivity of Large Language Model Leaderboards." We'll explore how minor changes in benchmark setups can drastically alter the rankings of LLMs, why this happens, and what best practices can be implemented for more robust evaluations. Don't miss out on understanding the pitfalls of relying solely on leaderboard ...
But Google's Gemma-2 is here !!
มุมมอง 484 หลายเดือนก่อน
Gemma-2 Research Paper: storage.googleapis.com/deepmind-media/gemma/gemma-2-report.pdf Gemma-2 Blog: blog.google/technology/developers/google-gemma-2/ Google's Gemma HugigngFace: huggingface.co/google/gemma-2-9b-it Try Gemma on HuggingFace Chat: huggingface.co/chat My Links 🔗 👉🏻 Subscribe: youtube.com/@Tensordroid 👉🏻 Twitter: vishesh_t27 👉🏻 LinkedIn: www.linkedin.com/in/vishesh-trip...
Weekly ML News Episode -7
มุมมอง 444 หลายเดือนก่อน
Weekly ML News Episode -7
Table Extraction for RAG !!
มุมมอง 6294 หลายเดือนก่อน
Table Extraction for RAG !!
Training and adding new tokens in a Pre-trained Tokenizer !!
มุมมอง 2154 หลายเดือนก่อน
Training and adding new tokens in a Pre-trained Tokenizer !!
Weekly ML News Episode - 6
มุมมอง 404 หลายเดือนก่อน
Weekly ML News Episode - 6
But Mistral-AI's Codestral is here !!
มุมมอง 614 หลายเดือนก่อน
But Mistral-AI's Codestral is here !!
But Meta's Chameleon is here !!!
มุมมอง 2145 หลายเดือนก่อน
But Meta's Chameleon is here !!!
But what is Paged Attention !!
มุมมอง 5875 หลายเดือนก่อน
But what is Paged Attention !!
Weekly Machine Learning News Episode - 5
มุมมอง 475 หลายเดือนก่อน
Weekly Machine Learning News Episode - 5
Getting a Machine Learning Job/Internship in 2024 !!
มุมมอง 5915 หลายเดือนก่อน
Getting a Machine Learning Job/Internship in 2024 !!
All AI Updates from Google I/O 2024 🤯
มุมมอง 1545 หลายเดือนก่อน
All AI Updates from Google I/O 2024 🤯
But Open-AI's GPT-4o is here !!
มุมมอง 1075 หลายเดือนก่อน
But Open-AI's GPT-4o is here !!
Weekly Machine Learning News Episode - 4
มุมมอง 315 หลายเดือนก่อน
Weekly Machine Learning News Episode - 4
Key Value Cache in Large Language Models Explained
มุมมอง 2K5 หลายเดือนก่อน
Key Value Cache in Large Language Models Explained
Machine Learning Engineer Roadmap 2024 !!
มุมมอง 8825 หลายเดือนก่อน
Machine Learning Engineer Roadmap 2024 !!
Weekly Machine Learning News Episode - 3
มุมมอง 745 หลายเดือนก่อน
Weekly Machine Learning News Episode - 3

ความคิดเห็น

  • @advaychandratre2220
    @advaychandratre2220 2 วันที่ผ่านมา

    Hi, Great video, i am trying to build a model that will do OCR for driving license and rc book using PALI, how do you think i should approach this model

  • @PraffulPawar-c9t
    @PraffulPawar-c9t 4 วันที่ผ่านมา

    You are basically reading from the slides, it could have been much better if you could have refreshed/brushed upon the concept of paging and then explained how paged attention works

  • @siddharthmanumusic
    @siddharthmanumusic 5 วันที่ผ่านมา

    Straight to the point and insightful

  • @subhamlaha8232
    @subhamlaha8232 7 วันที่ผ่านมา

    please provide link for transformers video

  • @tomzhang9186
    @tomzhang9186 25 วันที่ผ่านมา

    where is paper published to?

  • @siddhantsingh8999
    @siddhantsingh8999 หลายเดือนก่อน

    This was informative 💯

    • @Tensordroid
      @Tensordroid หลายเดือนก่อน

      Thanks !

  • @S.Ahmed730
    @S.Ahmed730 หลายเดือนก่อน

    great achievement thank you

  • @himanshuseditography8224
    @himanshuseditography8224 2 หลายเดือนก่อน

    Hey Bro Is there any Chance of increase in No. of Submission(Right Now It's only 2)

  • @pranilpatil4109
    @pranilpatil4109 2 หลายเดือนก่อน

    I did the same for 22 Indian languages. But when I searched a kannada language character in the tokens for a test purpose, it was not showing anything. Also, tokenizer separates punctuation as well. Your method of splitting is not optimal.

  • @veritaz753
    @veritaz753 2 หลายเดือนก่อน

    whats the minimum spec to run this??

    • @Tensordroid
      @Tensordroid 2 หลายเดือนก่อน

      Atleast 2 A10

  • @rbrowne4255
    @rbrowne4255 2 หลายเดือนก่อน

    thanks for the video, from an inferencing hardware point of view, it would be good to see basic results comparing performance on a Multi-GPU system with NVLINK and without, meaning the GPUs using the PCIe bus on the host system

  • @IlllIlllIlllIlll
    @IlllIlllIlllIlll 2 หลายเดือนก่อน

    Is kv cache in every LLM? How about the small models

  • @tharunbhaskar6795
    @tharunbhaskar6795 2 หลายเดือนก่อน

    Some quality content here. So the new tokens just get appended to the current tokenizer right?

  • @sajjadrahman256
    @sajjadrahman256 2 หลายเดือนก่อน

    awesome presentation and make sense .❤

    • @Tensordroid
      @Tensordroid 2 หลายเดือนก่อน

      Glad you liked it

  • @priteshtadvi4946
    @priteshtadvi4946 2 หลายเดือนก่อน

    Very well explained !!! Good work 👍 Keep it up 🤝

    • @Tensordroid
      @Tensordroid 2 หลายเดือนก่อน

      Thanks !!

  • @SufiyanSiddique
    @SufiyanSiddique 3 หลายเดือนก่อน

    from systemxpert???

  • @Keep_going_no_matter_what
    @Keep_going_no_matter_what 3 หลายเดือนก่อน

    Can I learn java for ML ?

    • @Tensordroid
      @Tensordroid 3 หลายเดือนก่อน

      Java is good for DSA, but for ML, you need to learn ML

  • @littleglitch5853
    @littleglitch5853 3 หลายเดือนก่อน

    can you give the ppt is shown in the video please?

    • @Tensordroid
      @Tensordroid 2 หลายเดือนก่อน

      here you go: docs.google.com/presentation/d/1hfK_k0jotCNwZWMDuHsbeL3R4r5q7hCwQXsJWbE3o6k/edit?usp=sharing

  • @karthikb547
    @karthikb547 4 หลายเดือนก่อน

    Thanks for sharing:)

  • @priteshtadvi4946
    @priteshtadvi4946 4 หลายเดือนก่อน

    Very good research and well explained 🙌

    • @Tensordroid
      @Tensordroid 4 หลายเดือนก่อน

      Thank you so much !!

  • @yatinshekhar787
    @yatinshekhar787 4 หลายเดือนก่อน

    dsa in python or java. Coz I saw your leetcode and majority of the problems are solved using java

    • @Tensordroid
      @Tensordroid 4 หลายเดือนก่อน

      it's a choice, I did in java, because DSA is always better in C++ or Java. but python also works, as I have shifted to work in python full time, I am going to do DSA in python only

  • @akarsh-tripathi
    @akarsh-tripathi 4 หลายเดือนก่อน

    Nice one, Vishesh

    • @Tensordroid
      @Tensordroid 4 หลายเดือนก่อน

      Thanks

  • @CantBeSubh
    @CantBeSubh 4 หลายเดือนก่อน

    good shit bro

    • @Tensordroid
      @Tensordroid 4 หลายเดือนก่อน

      thanks

  • @CantBeSubh
    @CantBeSubh 4 หลายเดือนก่อน

    thanks g, you the best.

  • @akarsh-tripathi
    @akarsh-tripathi 4 หลายเดือนก่อน

    👏👏

  • @travellingbytes
    @travellingbytes 4 หลายเดือนก่อน

    🎉

  • @rishabhkumar-h8q
    @rishabhkumar-h8q 4 หลายเดือนก่อน

    What about cp and can we do dsa in python or it is modatory to do in cpp or java

  • @JesúsLópezLópez-u6q
    @JesúsLópezLópez-u6q 5 หลายเดือนก่อน

    always a goddamn indian

  • @sh1w5z
    @sh1w5z 5 หลายเดือนก่อน

    Volume is abit low

    • @Tensordroid
      @Tensordroid 5 หลายเดือนก่อน

      Sorry, some mic issue

  • @anantagarwal8279
    @anantagarwal8279 5 หลายเดือนก่อน

    do you earn enough to pay back the loan for vit? im not being condescending , im okay and happy with a very little disposable income but if u earn really good that is just cherry on top

    • @Tensordroid
      @Tensordroid 5 หลายเดือนก่อน

      I actually did not take any loan, my income I would say is descent, I am able to afford stuff I want rn

    • @anantagarwal8279
      @anantagarwal8279 5 หลายเดือนก่อน

      @@Tensordroid but its fees is so high ?

  • @micalopez3707
    @micalopez3707 5 หลายเดือนก่อน

    Sorry for asking, at 1 year of distance. But if I want to detect something outside the YAMnet labels, like creating a new label, then YAMnet is not whorty any more right? Or is it whorty anyway for the power of the whole dataset, and training it with new audio to create new label would be a good idea? And then how to do it in a proper way?

    • @Tensordroid
      @Tensordroid 5 หลายเดือนก่อน

      No problem ! ummm, if you want to detect something outside YAMNet's existing labels, you can still use YAMNet for its powerful pre-trained features. So actually you can use transfer learning: extract features from your new audio data using YAMNet, then train a new model on these features with your custom labels. this approach will help you from YAMNet's dataset while adapting it to your specific needs.

  • @rishavagrawal9070
    @rishavagrawal9070 5 หลายเดือนก่อน

    Can you share more respurces for maths

    • @Tensordroid
      @Tensordroid 5 หลายเดือนก่อน

      You can also study from khan-academy Rest Ig these 2 are more than enough for ML

  • @Prathamos
    @Prathamos 5 หลายเดือนก่อน

    Skarparised you bro ❤ 6:56

  • @_Future_IITian
    @_Future_IITian 5 หลายเดือนก่อน

    Hi bhaiya I am going to join lnct bhopal btech ai ml this year . Please can you help me I am really really confused abt my clg but as much as I researched it is the only decent clg I am getting according to my rank in jee mains (89.35 %ile,1.59lk ). Q1. The doubt in my mind is will the faculties be good ? Q2. Will I get any good job ? (my goal is to learn ml ,neural networking, how to teach mechine through data ,how to build networks ,etc stuff in detail) Q3. Will I need to do mtech? From where? For Which exam I have to prepare for? Q4. What skill should I start learning ? (I know little bit of python like class 12th level I had created a billing program as my cs boards practical project using python and mysql In it you can login ,create productl ist,quantity, edit quantity , add ,remove(only admin can other staff can create bill only) , add user info , add his list,he will get discount on basis of his visit frequency ,it also provide demo data for user to examin software ) Q5. Should I start learning c++ or first complete python? Q6.What skills should I start learning? Q7. From where should I learn skills like coding, communication skills (I am horrible at it,also lnct clg do not have much activity ), etc? Q8. is possible to improve skill while maintaining 75% attendance ?(I do not participate in much events,trips I can spare time from it) . Q9. How helpful are clg lectures? And much more advice from you please help.

    • @_Future_IITian
      @_Future_IITian 5 หลายเดือนก่อน

      Hey brother please reply i need help

  • @akarsh-tripathi
    @akarsh-tripathi 5 หลายเดือนก่อน

    Nice Video, I'll start folliwing this 🌟

    • @Tensordroid
      @Tensordroid 5 หลายเดือนก่อน

      Thanks

  • @kwanhk6161
    @kwanhk6161 6 หลายเดือนก่อน

    the volume is very low, can’t hear clearly

    • @Tensordroid
      @Tensordroid 6 หลายเดือนก่อน

      Sorry, there was some mic issue

  • @vipuljaiswal4357
    @vipuljaiswal4357 6 หลายเดือนก่อน

    Insightful

    • @Tensordroid
      @Tensordroid 6 หลายเดือนก่อน

      Thanks !

  • @tanmaysharma7285
    @tanmaysharma7285 6 หลายเดือนก่อน

    🙌

  • @vipuljaiswal4357
    @vipuljaiswal4357 6 หลายเดือนก่อน

    Amazing

    • @Tensordroid
      @Tensordroid 6 หลายเดือนก่อน

      Thanks

  • @novmikvis
    @novmikvis 6 หลายเดือนก่อน

    What hardware do you need to run this locally?

    • @Tensordroid
      @Tensordroid 6 หลายเดือนก่อน

      You will need at-least 32 GB space, it you use torch.bfloat16, then 16 GB is required

    • @novmikvis
      @novmikvis 6 หลายเดือนก่อน

      @@Tensordroid Is this is System RAM or GPU VRAM?

    • @Tensordroid
      @Tensordroid 6 หลายเดือนก่อน

      @@novmikvis So you can set it right, on which you want to se using torch device, else device_map="auto", but the speed you are going to get at GPU is no where close to System RAM, you can use VLLM also for inferencing faster if you have multiple GPUs

    • @novmikvis
      @novmikvis 6 หลายเดือนก่อน

      @@Tensordroid Great! Thanks for clarifying that.

  • @vipuljaiswal4357
    @vipuljaiswal4357 6 หลายเดือนก่อน

    Amazing ❤

    • @Tensordroid
      @Tensordroid 6 หลายเดือนก่อน

      Thanks 😄

  • @gadgetassemble193
    @gadgetassemble193 6 หลายเดือนก่อน

    Can it help me in Data Science field? How?

    • @Tensordroid
      @Tensordroid 6 หลายเดือนก่อน

      It can help you get an interview atleast, because it is proof that you are doing good in tech stacks and hackathons

  • @BACSAbhishekBeedaki
    @BACSAbhishekBeedaki 7 หลายเดือนก่อน

    👍

  • @shreyashdhasade9717
    @shreyashdhasade9717 7 หลายเดือนก่อน

    Thank you

  • @HarshDewangan-kl9ur
    @HarshDewangan-kl9ur 7 หลายเดือนก่อน

    Is there any internship opportunity or can we request the HR there to refer us?

  • @nishantpatil8384
    @nishantpatil8384 8 หลายเดือนก่อน

    any way to make a website out of it?

  • @apoorvadas5226
    @apoorvadas5226 9 หลายเดือนก่อน

    Well done 👍

  • @tanishkasharma1889
    @tanishkasharma1889 9 หลายเดือนก่อน

    Congratulations 🎉

  • @DIVYEJOSHI
    @DIVYEJOSHI 10 หลายเดือนก่อน

    bhaiya is there any platform I can contact you like discord , I want to ask something about one project I am working on

  • @DeepakKumar-wz6oj
    @DeepakKumar-wz6oj 11 หลายเดือนก่อน

    BRO PLEASE TAKE A BIT BIG SIZE OF DATASET, THEN PERFORM THIS MODEL