- 65
- 117 420
AI开发者-就爱瞎鼓捣
เข้าร่วมเมื่อ 3 ม.ค. 2020
哈喽,我是瞎鼓捣~2024年,专注AI开发相关技术介绍。
技术资料:techdiylife.github.io/blog/
技术资料:techdiylife.github.io/blog/
LlamaIndex开发共学:5行代码搞定RAG + 改进实测对比
本期视频带你从零开始了解RAG实践方法!通过LlamaIndex,用5行代码实现最基础的RAG功能,并结合4个版本的改进方案进行效果对比,让你快速掌握优化RAG的关键技巧,轻松提升程序性能。
มุมมอง: 360
วีดีโอ
谁是最强开源大模型?顶流开源大模型性能实测
มุมมอง 2.1K16 ชั่วโมงที่ผ่านมา
本期视频带你深入评测最新顶流开源大模型!一起来看看它们与GPT-4o等闭源模型的差距有多大?谁才是现阶段最强的开源LLM? 视频中使用的GPUEZ云服务器:gpuez.com/
20个问题搞懂LLM评估与lm-eval的用法
มุมมอง 285หลายเดือนก่อน
通过20个LLM微调中的评估问题,带你全面了解评估在LLM微调中的重要性,以及如何使用lm-eval对LLM进行评估。
谁是最人气的LLM微调工具?
มุมมอง 575หลายเดือนก่อน
本视频介绍一下大模型微调相关的工具。一起来看看谁是最人气的大模型微调工具。 #LLM微调 #llamafactory #peft #unsloth #huggingface #MoE #视觉模型 #swift #魔搭
OpenAI推出搜索功能,谷歌该如何应对?
มุมมอง 609หลายเดือนก่อน
OpenAI 新推出的搜索功能引发热议,标志着 AI 搜索时代的到来。不同于传统的关键词检索,GPT-4o 的搜索功能基于自然语言处理,有望颠覆谷歌的地位。今天视频中我们将详细对比 OpenAI 搜索与谷歌搜索的不同,探讨这场搜索革命的影响。
AI开发动向:Hinton斩获诺奖,方便易用的豆包MarsCode编程助手,MeTA视频生成模型
มุมมอง 3642 หลายเดือนก่อน
本期视频为您分析AI最新动向:Hinton斩获诺贝尔物理学奖,令人惊讶不已;豆包MarsCode编程助手帮您提升开发效率。
从代码到细节:拆解LoRA微调的内部秘密!
มุมมอง 4292 หลายเดือนก่อน
本期视频深入解析了LoRA模型微调的原理和实现细节。从代码和模型的层面,揭示了微调后模型的具体变化。我们还探讨了微调大模型时常见的挑战,如显存占用、计算开销和存储空间压力,并解释了LoRA如何有效缓解这些问题。
揭秘 OpenAI 新应用 Canvas 的神奇力量!
มุมมอง 1.4K2 หลายเดือนก่อน
本视频介绍了 OpenAI 最新推出的应用 Canvas,这是一次针对应用的重大优化。视频将带你深入了解 Canvas 的核心功能,以及它如何为用户提供更高效的体验。
AI开发必看!OpenAI开发者日4大新功能全解析!DevDay
มุมมอง 8812 หลายเดือนก่อน
OpenAI开发者日上没有新模型发布,但却带来了4个全新的实用功能:实时API、视觉模型微调、提示词缓存和模型蒸馏。
Meta重磅发布首个多模态Llama 3.2,视觉处理11B 90B参数!
มุมมอง 7123 หลายเดือนก่อน
Meta正式开源了首个多模态Llama 3.2系列模型,带来1B和3B的文本生成模型以及11B和90B的视觉处理模型。
AI开发者动态:Cursor带来焦虑,Reflection大翻车,RAG落地思路
มุมมอง 4.2K3 หลายเดือนก่อน
AI开发者动态:Cursor带来焦虑,Reflection大翻车,RAG落地思路
终极PK!Reflection硬刚GPT-4、GPT-4o、Llama 3.1 70B和Qwen2 72B!
มุมมอง 1.3K3 หลายเดือนก่อน
终极PK!Reflection硬刚GPT-4、GPT-4o、Llama 3.1 70B和Qwen2 72B!
LlamaIndex共学专题文档:techdiylife.github.io/blog/blog.html?category1=c02&blogid=0071
看了你的問題,有點明白了
评估很专业
中文提示词并不合适,这些大模型主要训练用的数据集都是英文
想测试的就是中文环境下的使用体验主观测试
@techdiylife 中文,或者多语言的话,gemini的表现会好一些,还是训练数据集的问题
评测问题,本地安装方法相关文档:techdiylife.github.io/blog/blog.html?category1=c02&blogid=0072 GPUEZ云服务器链接:gpuez.com
請問有文檔嗎? 到B站上看也沒看到
抱歉文档还没有来得及上传,今天稍晚会公开
文档公开了,请见置顶评论
技术文档链接:techdiylife.github.io/blog/blog.html?category1=c02&blogid=0071
来了
最准的还是用操作系统级别的库来监视资源调用情况
非常有用!!!感谢总结
我打开显示网页不存在啊
视频中的统计数据:techdiylife.github.io/blog/blog.html?category1=c01&blogid=0070
會出一集使用 HF 來微調模型的教學嗎?
会有相关的分享,至少也会分享一些代码和技术文档
@techdiylife 期待👍🏻
有文档链接吗?
techdiylife.github.io/blog/blog.html?category1=c02&blogid=0053
视频中的文档:techdiylife.github.io/blog/blog.html?category1=c02&blogid=0068
感谢分享
竞争真的是很激烈啊,感觉每过一段就有其中一家反超另一家。perplexity要加油了。不过perplexity刚推出了space功能可以上传多个文件,根据文件内容提问。
我绝大多数搜索都是基于关键词找网页,并不是问问题。总的来说,AI搜索听起来很酷,但是不实用。
現在的google真他媽又爛又難用 以前找首歌沒有在找不到的 現在前10頁直接滿滿的給你全是廣告 不然就是要付費的 要像幾十年前一樣一搜一堆可用資源簡直作夢 google這樣爛下去真的不如倒一倒吧
标题很猛。
视频中的文档:techdiylife.github.io/blog/blog.html?category1=c01&blogid=0066
blackbox插件也不错啊
没看懂 好像懂了 网址打开了 发现根本不懂 懂得是“哦 将压力分给硬盘 内存 cpu的这种技术终于出了” 要的是运行 出个代码 没有解释怎么用
同质化的内容太多太多了
一点不都不多此一举
請問如果需要同時執行多個function, openai的API回覆會說 需要call 兩個funnction嗎? 可能像是請跟我說訂單當天的天氣 就需要去Call 訂單的時間再去call 天氣 謝謝!
OpenAI的模型是支持多个function的,看返回数据的格式,应该也是可以同时返回多个function调用。你可以参考这个讨论:community.openai.com/t/emulated-multi-function-calls-within-one-request/269582
可以接到memo裡面嗎
技术文档:techdiylife.github.io/blog/blog.html?category1=c01&blogid=0065
内容实用,满满干货。
大模型是按照token来的 你去让他算字母
还真有道理。 作为用户,才不管它怎么处理的。
你说的13b的模型超过gpt4,说的是phi吧
论文里没有看过,应该不是吧
您的笔记本电脑硬件配置,比如内存、硬盘、显卡、中央处理单元?
想說剛好想反是7B才應該是主力,問題出在「何時需要使用模型」?當用戶有大量資料需要人手處理時,轉成70B以上的模型跑速不夠快又貴,開幾個70B只能排隊等著辦,相反大量的平價 7B 同等價錢可以連開幾十條隊伍,處理資料的速度大增;另外70B和7B使用起來最大差別是問題複雜程度,70B雖然可以處理複雜問題單發解決,但只要把問題拆細,容許模型在回答問題時可以簡化答案,7B 也可以跑得又快又好,所以prompting engineer貴在前置作業吧?P.S> 不用花時間測試7B以下,例如Phi 1.5B ,簡直是浪費時間,那貨連基本JSON都列不出來
这才哪到哪,这个才是o1,未来迭代会越来越快,现在只是刚刚开始
和 reflection 想法类似,某种程度上算是能泛化的CoT,通过训练自己学习构建 CoT 的的能力,而不是通过输入先验,猜测这个花这么久,难点之一还是构造高质量的训练数据,不然就是Refection 那样一顿瞎说
問它黎曼猜想......
小心它来毁灭人类。
你的这几个问题很好,看了看全网都在质疑新模型,你的评测非常直观
没看出来有多强,不带搜索功能 我还在用4o o1-preview 只是告诉了你他的思考过程
会主动思考了, 前几天被吐槽的reflection算是o1的简化版
@@techdiylife感觉还是好很多了,思考超级重要
带走又一箱 估计是 take another case.
为什么我不在群里,如何加群?
通过这个链接:techdiylife.github.io/blog/blog.html?category1=c05&blogid=0032
cursor既然也是大语言模型,本质和直接用gpt4不是没有什么区别吗? 只是方便很多吧
一个是基本工具,一个是产品
得了吧,套了Claude的壳
哈哈,两个骗子忽悠人。
請問要怎麼入群??
通过这个链接:techdiylife.github.io/blog/blog.html?category1=c05&blogid=0032
念了一通新闻,我以为什么自己的看法,原来是没有,就是范范的说了下最近的新闻。这些新闻我都看过了,然后了,up你有什么深入的信息可以提供吗。比如 Reflection 到底真实性如何
感谢反馈
没道理
加速了就听不清了,建议用一个清脆一点的AI语音代替人声
多谢反馈
Your GPT-4o is not same as mine.
只想知道你自己的评测为什么那么好,是 test sample 太少了吗?本来也很怀疑它,结果看了你的视频还选择相信了它。
就测试了几个问题,很难真的说明问题。
Clark Karen Perez Larry Miller Betty