
标签:
Web Scraper是一款非常好用的网页爬虫插件,它可以帮助用户轻松抓取网站上的所有数据内容,而且用户完全不需要编写任何代码。Web Scraper适用于各种类型的网站,还支持将抓取的内容导出为CSV格式的文件,有需要的用户快来下载吧。

一个简易的网页爬虫插件,可以帮助不懂代码的用户实现数据爬取功能。
使用此扩展,您可以创建一个sitemap(站点地图),包含该如何遍历网站以及应提取哪些内容等。
使用这些sitemap,Web Scraper将相应地导航站点并提取所有数据。
稍后,可以将已筛选的数据导出为CSV。
1、标签页输入【chrome://extensions/】进入chrome扩展程序,解压你在本页下载的Web Scraper插件,并拖入扩展程序页即可。
2、插件安装完成后,在浏览器中会出现其按钮标记。用户可以先在设置页面中对该插件的储存设置和储存类型功能进行设置。
3、用户可以使用Web Scraper插件来抓取页面,其操作方法如下:
1)、打开你要抓取的网页。
首先要使用该插件来提取网页数据需要在开发者工具模式中使用,使用快捷键Ctrl+Shift+I/F12或者点击右键,选择“检查(Inspect)”,在开发者工具下面就能看到WebScraper的Tab。如下图所示:

2)、新建一个Sitemap。点击Create New Sitemap,里面有两个选项,import sitemap是指导入一个现成的sitemap,咱小白一般没有现成的,所以一般不选这个,选create sitemap 就好。

然后进行这两个操作:
(1)Sitemap Name:代表你这个Sitemap是适用于哪一个网页的,所以你可以根据网页来自命名,不过需要使用英文字母,比如我抓的是今日头条的数据,那我就用toutiao来命名;
(2)Sitemap URL:把网页链接复制到Star URL这一栏,比如图片里我把「吴晓波频道」的主页链接复制到了这一栏,而后点击下方的create sitemap来新建一个Sitemap。
3)、设置这个Sitemap
整个Web Scraper的抓取逻辑是这样:设置一级 Selector,选定抓取范围;在一级 Selector 下设置二级 Selector,选定抓取字段,然后抓取。
对于文章而言,一级 Selector 就是你要把这一块文章的要素圈出来,这个要素可能包含了 标题、作者、发布时间、评论数等等,然后我们再在二级 Selector 中挑出我们要的要素,比如标题、作者、阅读数。
下面我们来拆解这个设置一级、二级 Selector 的工作流:

(1)点击 Add new selector 创建一级 Selector。
而后按照以下步骤操作:
输入id:id代表你抓取的整个范围,比如这里是文章,我们可以命名为wuxiaoboarticles;
选择Type:type 代表你抓取的这部分的类型,比如元素/文本/链接,因为这个是整个文章要素范围选取,我们需要用Element 来先整体选取(如果这个网页需要滑动加载更多,那就选 Element Scroll Down);
勾选Multiple:勾选 Multiple 前面的小框,因为你要选的是多个元素而不是单个元素,当我们勾选的时候,爬虫插件会帮助我们识别多篇同类的文章;
保留设置:其余未提及部分保留默认设置。
(2)点击select选择范围,按照以下步骤操作:
选择范围:用鼠标选择你要爬取数据的范围,绿色是待选区域,用鼠标点击后变为红色,才是选中了这块区域;
多选:不要只选一个,下面的也要选,否则爬出来的数据也只有一行;
完成选择:记得点Done Selecting;
保存:点击Save Selector。

(3)设置好了这个一级的Selector之后,点进去设置二级的Selector,按照以下步骤操作:
新建Selector:点击 Add new selector ;
输入id:id代表你抓取的是哪个字段,所以可以取该字段的英文,比如我要选「作者」,我就写「writer」;
选择Type:选Text,因为你要抓取的是文本;
勿勾选Multiple:不要勾选 Multiple 前面的小框,因为我们在这里要抓取的是单个元素;
保留设置:其余未提及部分保留默认设置。

(4)点击 select,再点击你要爬取的字段,按照以下步骤操作:
选择字段:这里爬取的字段是单个的,用鼠标点击该字段即可选定,比如要爬标题,那就用鼠标点击某篇文章的标题,当字段所在区域变红即为选中;
完成选择:记得点 Done Selecting;
保存:点击 Save Selector。

(5)重复以上操作,直到选完你想爬的字段。
4、爬取数据
(1)之后你想要爬取数据只需要设置完所有的Selector就可以开始:
点击Scrape,然后点Start Scraping,弹出一个小窗后爬虫就会开始工作。你会得到一个列表,上面有你想要的所有数据。
(2)如果你希望把这些数据做一个排序,比如按照阅读量、赞数、作者等指标排序,让数据更一目了然,那么你可以点击 Export Data as CSV,把它导入 Excel 表里。
(3)导入 Excel 表格之后,你就可以对数据进行筛选了。

我们这里只是简单介绍总结了Web Scraper的插件的功能,安装以及一个简单的单页面例子。其实Web Scraper的功能远远不止于此,其实还能抓取分页,还能多页多元素的抓取,还能抓取二级页面。
1:该下载地址为九点软件园本地下载地址,Web Scraper最新版下载包预览图如下:

2:下载包的正确包名:WebScraper_9a9m.com.zip
3:九点小编提醒本下载包九点小编亲自上传,上传时间为2025年9月26日,如果失效评论区留意反馈(小编上传的很辛苦喜欢就点个赞吧)
RdfToDbf最新版下载-RdfToDbf(Rdf数据转换Dbf软件) v1.6 官方版下载
MsSqlToMongo最新版下载-MsSqlToMongo(MsSql转Mongo工具) v1.4 官方版下载
JMeter最新版下载-JMeter【编程测试软件】 v5.1.1官方版下载
ThinkCMFX最新版下载-ThinkCMFX(开源内容管理框架) v6.0 官方版下载
DecSoft HTML Compiler最新版下载-DecSoft HTML Compiler(HTML编译工具) v2021.10官方版下载
DiYunCMS最新版下载-DiYunCMS(帝云CMS) v4.3.14 官方版下载
sonarqube最新版下载-sonarqube(代码质量分析工具) v8.7 官方版下载
ReSharper最新版下载-ReSharper免费版 v2023.3.1官方版下载
Selenium自动化测试框架最新版下载-Selenium自动化测试框架v3.6.2官方版下载
Devcpp免费版下载-Devcpp中文版v6.7.5官方版下载
JetBrains Fleet安装包下载-JetBrains Fleet【IDE编辑器】v1.5.72官方版下载
commons-dbcp.jar下载-commons-dbcp.jar免费版下载
ApiPost下载-ApiPost(接口调试与文档生成工具) v6.1.5官方版下载
eWebEditor最新版下载-eWebEditor编辑器 v2020官方版下载
EOVA下载-EOVA(简单开发平台) v1.6.0官方版下载
hamcrest library.jar下载-hamcrest library.jar v1.3官方版下载
ADO查询工具下载-MiTec ADO Query(ADO查询工具) v1.9.0.0官方绿色版下载
Microsoft .NET Core最新版下载-Microsoft .NET Core v3.1.11 官方版下载
Linkis下载-Linkis(微服务架构) v0.11.0官方版下载
nodejs长期支持版下载-nodejs长期支持版 v16.16.0 官方版下载
e4a破解版下载-易安卓E4A(含破解补丁) v7.1.14免注册版下载500.44MB4663人在玩易安卓E4A是九点小编为大家推荐的一款非常好用并基于谷歌Simple语言、专为安卓系统开发应用打造的编程辅助工具软件,让安卓开发无限简单,可以说是安卓版本的易语言程序。
下载
火山编程破解版下载-火山软件开发平台 V2.0绿色破解版下载1.2GB3570人在玩火山软件开发平台是九点小编为编程开发用户分享的全新专业且深受诸多用户们喜爱的软件开发编程工具应用,是一种目的硬件设备无关、目的软件环境无关、易学易用实用、完全本地化的软件快速开发平台,有着极高流畅度的专业型迅速软件软件开发平台
下载
appinventor下载-App Inventor安卓编程软件V2023最新版下载310M1962人在玩App Inventor是九点小编为程序员们推荐的一种基于Web的开发环境,用于创建Android应用程序。它是由麻省理工学院(MIT)开发的,旨在使移动应用程序开发变得更加易于学习和使用。
下载
米思齐编程软件下载-Mixly(米思齐图形化编程工具) v2.0 RC4官方版下载263.2M1515人在玩Mixly For Arduino(米思齐图形化编程工具)windows版,基于Google的Blockly图形化编程框架开发,目的是为了配合Arduino UNO开发板套件使用,实现Arduino程序的图像化编程,Mixly自带Java8运行环境,用户直接双击mixly.vbs即可使用。
下载
星三好图形化编程软件下载-星三好图形化编程 v3.7.0官方版下载141MB1370人在玩星三好图形化编程软件是九点小编为大家推荐的一款功能强大,专业实用的优秀网络编程学习软件,用户能够通过积木形状模块来实现构成程序的命令和参数,只需要用鼠标拖动模块就能完成编程,欢迎下载使用。
下载
易语言5.9破解版下载-易语言 V5.9完美破解版下载313.71MB1127人在玩易语言是九点小编为大家推荐的一款转为国人而设计的编程软件,由大连大有吴涛易语言软件开发有限公司推出,通过对易语言的学习,即便用户的英语水平不够好也能够轻松进行编程操作,让那些想编程且又不会英文的朋友们,提供了一条快速进入Windows程序编程的大门,支持基于汉语字、词编程的、全可视化的、跨主流操作系统平台的编程工具。
下载
oracle 客户端下载-Oracle 11G客户端(32/64位) v11.2.0.4.0免费版下载1.95G1055人在玩oracle11g客户端 是从 Oralce 11gR2 的官方客户端安装包中而来的 Oracle 数据库客户端,专为企业设计,轻松运行大量数据库除了可以连接远程数据库以外,还包含 SQL Plus、JDBC Driver、ODBC Driver、Pro*C SDK、Net Configuration Assistant、Net Manager 等。
下载
navicat15破解版下载-Navicat 15 绿色版下载115MB904人在玩Navicat 15是九点小编为大家推荐的一款功能强大的数据库管理软件,软件采用可视化操作方式,无需任何代码即可轻松完成数据库的增删改查、备份等操作,可以帮助用户更好的管理数据库。
下载
jdk-8u201-windows-x64.exe下载-jdk-8u121-windows-x64(java se开发工具包) 下载194MB737人在玩jdk-8u121-windows-x64 ,最新的JDK 8u121 发布了,Java SE 8u121包括重要的安全修复。Oracle强烈建议所有Java SE 8用户升级到此版本,JDK 8u121包含 2016i 版本的IANA时区数据,还包含一些安全问题的修复,有需要的赶快下载吧!
下载
jdk1.832位下载-Java jdk1.8(32/64)官方版下载340M723人在玩Java JDK是九点小编为大家推荐的一款适用于开发人员必备的一款环境开发软件,这款软件用于构建应用程序、applet程序以及java编程语言的组成部分。九点软件园为大家带来的是JDK1.8版本,下面为大家分享一下安装方法以及下载地址吧!
下载