创建时间:2024年2月28号
在一个偶然的机会,我在某个网站上发现了一个专门爬取美女图片的爬虫程序,这立刻激发了我的兴趣。我决定将其下载下来,进行深入的学习和研究。在理解并掌握了其基本原理和技术后,我根据自己的编程习惯和审美标准,对其进行了调整和优化。这个程序不仅涉及到了XPath的使用,让我能够更精确地定位和提取网页中的图片元素,还让我实践了基本的爬虫技术,锻炼了我的数据处理能力。同时,通过运用os模块创建文件夹和检测文件夹是否存在,我实现了对下载图片的有效管理和组织。
该项目旨在专门抓取位于 路径下的图片。考虑到网站上可能还存在其他形式的图片,这些将不作为处理对象。在执行爬虫任务时,若遇到抓取某张图片时出现问题,程序将自动跳过该图片(本程序未做),并将出错的相关信息打印出来,以便后续进行处理。通过这种方式,我们的爬虫能够更加精准地定位并获取目标图片,同时保证在遇到问题时仍能继续运行,提高爬虫的鲁棒性和效率。
悄悄告诉你:下面还有一个简单一点的