ขนาดวิดีโอ: 1280 X 720853 X 480640 X 360
แสดงแผงควบคุมโปรแกรมเล่น
เล่นอัตโนมัติ
เล่นใหม่
听了一大堆介绍 cursor 的,完全没有体验的动力,通义千问已经能很好满足,但是这个爬取过程我太兴奋了,好想体验一下,之前是找人帮我爬工信部的数据,需要我自己确定哪些页面,交给程序员,虽然也快但始终麻烦人家,现在可以自己搞定了,太棒,感谢作者
得了吧,通义千问的回答那么烂,废话连篇,过分的RAG,能和cursor比吗?
非常好,这是关于cursor讲的最好中文视频。
这里边最关键的还是自己要懂Python和selenuium,没有这个前提根本没法开始。
你写代码之前,花三五天了解一下框架就够了
不用的,你用chatgpt和claude写个爬虫简简单单,懂逻辑就行
我觉得这就是未来程序员的雏形。需要懂得怎么实现一个功能,代码应该是如何写的,怎么写是好的是对的,基本语法是什么。AI能帮你的就是代替你完成“你已经会做的”事情,这点很重要!不然你只会盯着一堆不能跑的代码!
在打个比方,就像是你遇到git merge conflict,AI不能代替你做出决定,你需要自己知道如何解决那些merge conflict。
@@fanyinU 对,我最近在用AI做terraform GCP, 问题是tf plan都能过,但是一旦到tf apply就完全不行了,因为AI没法看到我云里的interaction. AI能给我一个起点,但是到终点还是要自己来。
你要想做一个更专业的report template, 看看JSreport吧。
央行网页,高频访问会封IP。。或者无线循环转跳到首页
兴致勃勃点开,看到selenium就把视频关了
請教一下為甚麼呢?
@@pensis 在爬虫的方案里,使用selenium是最简单(low)的,因为原理是需要渲染web页面,通过定位页面元素获取信息,这会有很多的问题。比较好的方案是抓包并模拟,直接请求服务器。
@@JimX-d3m 直觀運用哪裡不好 有些動態網頁直接請求還抓不到呢
@@JimX-d3m scrapy?怎么样
扯鸡八谈吧,你到底懂不懂,很多内容都要渲染才抓得到,比如对方如果是vue开发的,你请求的就是一个main.js你能趴到什么?沙的很,现在我们公司招的爬虫只要提到模拟请求我马上不要,当然最好的爬虫方案也不是selenium。@@JimX-d3m
我什么我的开发展工具那里没有复制整个html的选项?只能复制选中的元素。复制这里可以讲详细一点啊
这个ai语音还可以
动态加载的网页怎么抓
我搞这个需要火车头采集,如果采集电商网站,cursor这个能比火车头效率高吗
起码得是gpt的api,通义没办法
打完需求前代碼早就開發測試上限完畢了
你之前做的 哪个 节点还能用吗 大师
什么节点?
@@Lion3D-pb1bz 就是自建的 节点
请问你用的是什么插件?打出前面的字后面的可以自动联想
cursor 自带的
感觉很快专业AI爬虫工具就会出现了,输入需求,直接出结果。用cursor也是从头到尾传话,没有理由它自己不会一边run一边修复bug
用o1
没这种可能,爬虫是一个典型的“道高一尺,魔高一丈”的行当。再者说了,如果有这种东西,你让lightdata之类的公司怎么活
gpt canvas 跟 这个能实现同样功能吗
如果只是写代码应该都可以,但是cursor可以直接在ide里面执行,canvas的话不包含运行环境,得需要自己复制到别的地方再运行
请问这个AI语音是什么生成的
GPT-SoVITS
爬蟲比較困難的是,遇到cloudflare的反爬
selenium
@@Lion3D-pb1bzselenuim被cloudflare擋死死的
真正有價值的是如何應對這些反爬網站,一般可爬的難度偏低
@@rogerroan7583 不了解cloudflare,selenium 是通过浏览器爬取,基本上你能看到的数据都能够爬取。实在不行可以用本地的大模型,大致的流程是将你想爬的界面截图发给大模型让它识别,只不过那样效率相对较慢。
我就是专门做反爬的,这一块的利润很低,所有大家放的精力有限,搞不定就换慢速爬虫,搞多点代理跟机器。
求项目
请问你这个编程的环境叫个啥啊?是VSC吗,纯菜鸟,谢谢
cursor
cursor是vsc的一个fork,所以看着很像
请问这是哪个IDE?
@@Lion3D-pb1bz IDE是CURSOR吧?
@@roychan2190 对
Wind EDB一拉就有了
贵啊
丝滑的生成代码,然后丝滑的取代你。
太好了
人類是pilot,AI做co-pilot
@@0xLitchi 你说的是实际情况,然而这视频标题可不是这么写的。
接管浏览器实例的那段代码从哪来的?为啥不让cursor直接生成》?
GECKODRIVER_PATH = r"C:\python3\geckodriver.exe"driver = webdriver.Firefox(executable_path=GECKODRIVER_PATH, service_args=['--marionette-port', '2828', '--connect-existing'])
也可以生成,但是你打开浏览器时还要指定端口
你好,弄個群吧,有些事情想請教你啊!
请指示
@@Lion3D-pb1bz 你有tg群嗎?或者tg?我看了你的教程,我是小白,但是很想學習AI這些,看了你的教程我去註冊了cursor,但是不會用啊。
@@Lion3D-pb1bz 你是大神我不敢亂下命令啊😁
都退了吧,cursor不支持中国大陆地区.
评论区都是中文
真的假的,不是吧😢
支持
完全不懂也无法理解的
o1更好用
Cursor 是免费的吗
完全免费
收费的,新用户免费体验15天。
付费,还挺贵
前兩個禮拜免費試用,夠你用了
@@user-luzochegipiebutogeguger 试用完呢
1
听了一大堆介绍 cursor 的,完全没有体验的动力,通义千问已经能很好满足,但是这个爬取过程我太兴奋了,好想体验一下,之前是找人帮我爬工信部的数据,需要我自己确定哪些页面,交给程序员,虽然也快但始终麻烦人家,现在可以自己搞定了,太棒,感谢作者
得了吧,通义千问的回答那么烂,废话连篇,过分的RAG,能和cursor比吗?
非常好,这是关于cursor讲的最好中文视频。
这里边最关键的还是自己要懂Python和selenuium,没有这个前提根本没法开始。
你写代码之前,花三五天了解一下框架就够了
不用的,你用chatgpt和claude写个爬虫简简单单,懂逻辑就行
我觉得这就是未来程序员的雏形。需要懂得怎么实现一个功能,代码应该是如何写的,怎么写是好的是对的,基本语法是什么。AI能帮你的就是代替你完成“你已经会做的”事情,这点很重要!不然你只会盯着一堆不能跑的代码!
在打个比方,就像是你遇到git merge conflict,AI不能代替你做出决定,你需要自己知道如何解决那些merge conflict。
@@fanyinU 对,我最近在用AI做terraform GCP, 问题是tf plan都能过,但是一旦到tf apply就完全不行了,因为AI没法看到我云里的interaction. AI能给我一个起点,但是到终点还是要自己来。
你要想做一个更专业的report template, 看看JSreport吧。
央行网页,高频访问会封IP。。或者无线循环转跳到首页
兴致勃勃点开,看到selenium就把视频关了
請教一下為甚麼呢?
@@pensis 在爬虫的方案里,使用selenium是最简单(low)的,因为原理是需要渲染web页面,通过定位页面元素获取信息,这会有很多的问题。比较好的方案是抓包并模拟,直接请求服务器。
@@JimX-d3m 直觀運用哪裡不好 有些動態網頁直接請求還抓不到呢
@@JimX-d3m scrapy?怎么样
扯鸡八谈吧,你到底懂不懂,很多内容都要渲染才抓得到,比如对方如果是vue开发的,你请求的就是一个main.js你能趴到什么?沙的很,现在我们公司招的爬虫只要提到模拟请求我马上不要,当然最好的爬虫方案也不是selenium。@@JimX-d3m
我什么我的开发展工具那里没有复制整个html的选项?只能复制选中的元素。复制这里可以讲详细一点啊
这个ai语音还可以
动态加载的网页怎么抓
我搞这个需要火车头采集,如果采集电商网站,cursor这个能比火车头效率高吗
起码得是gpt的api,通义没办法
打完需求前代碼早就開發測試上限完畢了
你之前做的 哪个 节点还能用吗 大师
什么节点?
@@Lion3D-pb1bz 就是自建的 节点
请问你用的是什么插件?打出前面的字后面的可以自动联想
cursor 自带的
感觉很快专业AI爬虫工具就会出现了,输入需求,直接出结果。用cursor也是从头到尾传话,没有理由它自己不会一边run一边修复bug
用o1
没这种可能,爬虫是一个典型的“道高一尺,魔高一丈”的行当。再者说了,如果有这种东西,你让lightdata之类的公司怎么活
gpt canvas 跟 这个能实现同样功能吗
如果只是写代码应该都可以,但是cursor可以直接在ide里面执行,canvas的话不包含运行环境,得需要自己复制到别的地方再运行
请问这个AI语音是什么生成的
GPT-SoVITS
爬蟲比較困難的是,遇到cloudflare的反爬
selenium
@@Lion3D-pb1bzselenuim被cloudflare擋死死的
真正有價值的是如何應對這些反爬網站,一般可爬的難度偏低
@@rogerroan7583 不了解cloudflare,selenium 是通过浏览器爬取,基本上你能看到的数据都能够爬取。实在不行可以用本地的大模型,大致的流程是将你想爬的界面截图发给大模型让它识别,只不过那样效率相对较慢。
我就是专门做反爬的,这一块的利润很低,所有大家放的精力有限,搞不定就换慢速爬虫,搞多点代理跟机器。
求项目
请问你这个编程的环境叫个啥啊?是VSC吗,纯菜鸟,谢谢
cursor
cursor是vsc的一个fork,所以看着很像
请问这是哪个IDE?
@@Lion3D-pb1bz IDE是CURSOR吧?
@@roychan2190 对
Wind EDB一拉就有了
贵啊
丝滑的生成代码,然后丝滑的取代你。
太好了
人類是pilot,AI做co-pilot
@@0xLitchi 你说的是实际情况,然而这视频标题可不是这么写的。
接管浏览器实例的那段代码从哪来的?为啥不让cursor直接生成》?
GECKODRIVER_PATH = r"C:\python3\geckodriver.exe"
driver = webdriver.Firefox(executable_path=GECKODRIVER_PATH, service_args=['--marionette-port', '2828', '--connect-existing'])
也可以生成,但是你打开浏览器时还要指定端口
你好,弄個群吧,有些事情想請教你啊!
请指示
@@Lion3D-pb1bz 你有tg群嗎?或者tg?我看了你的教程,我是小白,但是很想學習AI這些,看了你的教程我去註冊了cursor,但是不會用啊。
@@Lion3D-pb1bz 你是大神我不敢亂下命令啊😁
都退了吧,cursor不支持中国大陆地区.
评论区都是中文
真的假的,不是吧😢
支持
完全不懂也无法理解的
o1更好用
Cursor 是免费的吗
完全免费
收费的,新用户免费体验15天。
付费,还挺贵
前兩個禮拜免費試用,夠你用了
@@user-luzochegipiebutogeguger 试用完呢
1