您现在的位置是：首页 » python编程资讯

资讯内容

介绍python60行代码写一个简单的笔趣阁爬虫

极客小将2021-01-16-

简介推荐（免费）：Python视频教程文章目录系列文章目录前言一、网页解析二、代码填写1.获取Html及写入方法2.其余代码总结前言利用python写一个简单的笔趣阁爬虫，根据输入的小说网址爬取整个小说并保存到txt文件。爬虫用到了BeautifulSoup库的select方法结果如图所示：本文只用于学

j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

推荐（免费）：python视频教程j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

文章目录j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

系列文章目录前言一、网页解析二、代码填写1.获取Html及写入方法2.其余代码总结

前言j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

利用python写一个简单的笔趣阁爬虫，根据输入的小说网址爬取整个小说并保存到txt文件。爬虫用到了BeautifulSoup库的select方法
结果如图所示：

本文只用于学习爬虫j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

一、网页解析j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

这里以斗罗大陆小说为例网址：
http://www.biquge001.com/Book/2/2486/

可以发现每章的网页地址和章节名都放在了 <"p id=list dl dd a>中的a标签中，所以利用BeautfulSoup中的select方法可以得到网址和章节名j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

Tag = BeautifulSoup(getHtmlText(url), "html.parser") #这里的getHtmlText是自己写的获取html的方法urls = Tag.select("p #list dl dd a")

然后遍历列表j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

for url in urls: href = "http://www.biquge001.com/" + url['href'] # 字符串的拼接拼接成正确的网址 pageName = url.text # 每章的章名

然后每章小说的内容都存放在<p id=“content” 里同理得
j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

substance = Tag.select("p #content") # 文章的内容

**后同理在首页获取小说的名称
<"p id = info h1>j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

bookName = Tag.select("p #info h1")

j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

二、代码填写j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

1.获取Html及写入方法j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

def getHtmlText(url): r = requests.get(url, headers=headers) r.encoding = r.apparent_encoding # 编码转换 r.raise_for_status() return r.textdef writeIntoTxt(filename, content): with open(filename, "w", encoding="utf-8") as f: f.write(content) f.close() print(filename + "已完成")

2.其余代码j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

代码如下（示例）：j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

url = "http://www.biquge001.com/Book/2/2486/"substanceStr = ""bookName1 = ""html = getHtmlText(url)# 判断是否存在这个文件Tag = BeautifulSoup(getHtmlText(url), "html.parser")urls = Tag.select("p #list dl dd a")bookName = Tag.select("p #info h1")for i in bookName: bookName1 = i.textif not os.path.exists(bookName1): os.mkdir(bookName1) print(bookName1 + "创建完成")else: print("文件已创建")for url in urls: href = "http://www.biquge001.com/" + url['href'] # 字符串的拼接拼接成正确的网址 pageName = url.text # 每章的章名 path = bookName1 + "\" # 路径 fileName = path + url.text + ".txt" # 文件名 = 路径 + 章节名 + ".txt" Tag = BeautifulSoup(getHtmlText(href), "html.parser") # 解析每张的网页 substance = Tag.select("p #content") # 文章的内容 for i in substance: substanceStr = i.text writeIntoTxt(fileName, substanceStr) time.sleep(1)

j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

总结j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

简单利用了BeautfulSoup的select方法对笔趣阁的网页进行了爬取 j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

更多相关学习敬请关注python教程栏目！

以上就是介绍python60行代码写一个简单的笔趣阁爬虫的详细内容，更多请关注少儿编程网其它相关文章！j27少儿编程网-Scratch_Python_教程_免费儿童编程学习平台

上一篇
Python数据分析实战之概述数据分析

简介Python教程栏目介绍概述数据。推荐（免费）：Python教程文章目录一、入门数据分析1.大数据时代的基本面2.数据分析师职业前景3.成为数据分析师之路二、Python的安装与环境配置1.Python版本2.不同系统安装Python3.环境变量配置4.安装pip5.集成开发环境选择三、Anacon

下一篇
Python培训机构靠谱吗？Python培训机构怎么选？

简介近几年，网络浪潮涌起，而Python市场一直是人才稀缺。Python语言简单易学，就业前景广自然也获得了年轻人的青睐。Python培训机构靠谱吗？Python培训机构怎么选？是每位学习者的纠结点，那么一个合格的Python培训机构是什么样子的呢？跟随小编筛一筛。一、培训机构地理位置就拿北京来说，哪个

相关资讯

预约试听课

已有385人预约都是免费的，你也试试吧...

精品课程

Scratch自学精品课程(45节课)目...

官方教程 10、录制声音

官方教程 9、制作音乐

官方教程 8、创作故事

官方教程 7、角色动画

推荐下载

Scratch 3.29.1 Windows版 Mac...

Scratch 3.26.0 Setup Windows...

Scratch 3.26 Mac版本官方下载...

scratchlink 下载

Scratch 3.23.1 Mac版本官方下...

Scratch 3.23.1 Setup Windows...

Scratch 3.22.0 Mac版本官方下...

Scratch 3.22.0 Setup Windows...

标签云

Scratch(112) python(56) 少儿编程(44) 蓝桥杯(32) 小升初(20) Scratch教材(19) 清华大学出版社(19) 电子学会(17) 等级考试(15) scratch作品(13) 真题(11) 数学(10) 人工智能(10) 算法(9) scratch等级(9) 四级考试(9) 三级考试(9) 电子协会(9) Scratch下载(9) 字典(6)

猜你喜欢

认识Scratch的舞台

Scratch电子学会等级考试时间和...

Scratch考试将会在近期进行全面...

Scratch编程：培养孩子创新思维...

学Scratch编程的费用一般是多少

Scratch教程：进阶课程-打地鼠

Scratch教程：进阶课程-打蝙蝠...

scratch教程判断 if then

Scratch计算三角形面积

Scratch会飞的巫婆

Scratch迷宫游戏设计

资讯内容

介绍python60行代码写一个简单的笔趣阁爬虫

Python数据分析实战之 概述数据分析

Python培训机构靠谱吗？Python培训机构怎么选？

相关资讯

预约试听课

Python数据分析实战之概述数据分析