爬虫学习笔记-scrapy链接提取器爬取读书网链接写入MySQL数据库

   日期:2024-12-25    作者:1sgmu 移动:http://oml01z.riyuangf.com/mobile/quote/12069.html

1.终端运行scrapy startproject scrapy_read,创建项目

 4.创建爬虫文件,并打开

6.修改爬虫文件规则allow(正则表达式),'d'表示数字,'+'表示多个,'.'使'.'生效

7.在parse_item中编写打印,scrapy crawl read运行爬虫文件

8.查看结果,成功打印,说明成功访问

10.读书网检查查看要爬取的数据

11.使用xpath获取

12.编写代码,打印,成功爬取

13.导包,创建book对象,给到管道

14.打开管道

15.pipelines中编写代码,将数据存储到json文件中,并运行

19.MySQL创建存储数据的表如下

20.settings中填写连接数据库所需的变量,根据自己的数据库填写

21.创建管道,编写代码,用来保存数据

        1).建立连接

        2).执行数据插入

        3).关闭连接

22.settings中启动管道

23.运行,查看成功存储到数据库


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号