Coze与Dify知识库问答对比 | 国产AI应用开发平台扣子能遥遥领先吗?

แชร์
ฝัง
  • เผยแพร่เมื่อ 16 ม.ค. 2025

ความคิดเห็น • 15

  • @johnnysong9781
    @johnnysong9781 5 วันที่ผ่านมา +2

    我在langchain里retriever是按256 tokens/chunk,overlap=128 tokens,每次查询50-100个chunks才稍微满意一点点

  • @heymoyu
    @heymoyu 7 วันที่ผ่านมา +3

    很好奇为啥没提供那种根据文档结构分块的方式。 比如先将 PDF 转换为带一级标题、二级标题、三级标题的 Markdown,父分块按二级标题,子分块按三级标题,这样就不会出现连贯性的内容被阶段的情况了,当然这也很考验 PDF 的解析技术

    • @gw1284
      @gw1284 2 วันที่ผ่านมา

      I have the same question too.

    • @gw1284
      @gw1284 2 วันที่ผ่านมา

      I have the same question too.

  • @Xiaoyi_Wang
    @Xiaoyi_Wang 7 วันที่ผ่านมา +2

    没错,是这样的。按自己尝试的结果来看,效果就是这样。所以rag是需要更好的方案的

  • @pg-kt
    @pg-kt 4 วันที่ผ่านมา +2

    分塊切太大定位不到是embedding模型的問題,超過1000 token準確度就會下降

  • @G0BYE0MAN
    @G0BYE0MAN 8 วันที่ผ่านมา +1

    很好的比較,謝謝。

  • @bailinsun
    @bailinsun 8 วันที่ผ่านมา +1

    通过子文档找到对应的父文档,确实减少了上下文断层的问题,但是对某些关联比较长的内容父文档之间也会有断层的问题

  • @飞张-e6q
    @飞张-e6q 5 วันที่ผ่านมา +2

    应该还是文档解析出了问题

  • @fastfading4667
    @fastfading4667 7 วันที่ผ่านมา

    我刚提这个需求, dify 就完成了。 dify 要是能支持多智能体, 就完美了。

  • @KC_79
    @KC_79 7 วันที่ผ่านมา +1

    不知道 NotebookLM 底層的設定, 但是簡單的操作和不錯的效果, 我覺得還是 RAG 最好用的一個.

    • @wuweizhi3148
      @wuweizhi3148 7 วันที่ผ่านมา

      NotebookLM目前不支持ocr,是个硬伤,有相当多的实际文档是图片形式pdf

    • @deco8396
      @deco8396 3 วันที่ผ่านมา

      @@wuweizhi3148 支持了吧

  • @ZeTang
    @ZeTang 8 วันที่ผ่านมา

    和加大chunk size 和 overlap 比效果会好多少哪

    • @01coder30
      @01coder30  7 วันที่ผ่านมา

      这个很难量化