From Words to Tokens: The Byte-Pair Encoding Algorithm

แชร์
ฝัง
  • เผยแพร่เมื่อ 11 พ.ค. 2024
  • Why do we keep talking about "tokens" in LLMs instead of words? It happens to be much more efficient to break the words into sub-words (tokens) for model performance!

ความคิดเห็น • 2

  • @georgehu8652
    @georgehu8652 หลายเดือนก่อน +1

    very well explained.

  • @saurabhchandra.in.
    @saurabhchandra.in. หลายเดือนก่อน +1

    Subscriber from substack