资讯内容
Python之自动获取目标网站最新通知
tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
python之自动获取目标网站**新通知:tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
1、建立通知数据库tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
这一步的目的是爬取目标网站已经发布的通知的数据,并进行存储,从而建立与该目标网站内容相对应的本地数据库。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
考虑到数据库中的数据将是辨别和获取一则新通知的**方法,因此所建立的数据库将存储每一条通知的标题、发布日期和访问链接。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
第一步使用到的模块有urllib、BeautifulSoup和sqlite3模块。其中,通过urllib模块爬取目标网页html数据;通过BeautifulSoup模块解析网页数据、爬取网页内容;通过sqlite3模块建立目标网站已有通知数据库。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
该步主要代码展示如下。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
2、建立邮件发送系统tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
这一步的目的是使用Python标准库模块smtplib来访问网络,创建一个发送电子邮件的功能。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
由于我们大部分人的计算机并没有建立自己的邮件服务器,因此需借助第三方服务器来模拟邮件发送。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
常用的有谷歌邮件系统、网易邮件系统和QQ邮件系统,如QQ邮件系统的SMTP服务器和端口号分别为smtp.qq.com和465。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
该步主要代码展示如下。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
在这个示例中,使用了Python标准库中的email模块将电子邮件信息进行了格式化,主要包括邮件的主题与发件人、收件人邮箱昵称和邮件内容等信息。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
3、解析检测目标网站通知tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
前面两步,已经完成了目标网站已有通知数据库和邮件发送系统的建立,第三步要完成的工作,主要由两部分组成。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
一是,利用第一步使用的urllib、BeautifulSoup模块解析目标网站内容数据,并与前面建立的数据库进行对比检测。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
二是,若检测到目标网站有新的通知,则将新通知数据插入到数据库中,然后,发送提示电子邮件。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
该步主要代码展示如下。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
在这个示例中,只选取了**新的一条通知发送了电子邮件提示,具体邮件信息可自己设定。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
4、制定计划任务tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
前面三步,已经完成了使用Python获取目标网站**新通知,并发送提示电子邮件的脚本程序。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
在这一步,将使用Windows自带的DOS命令框架和任务计划程序去每小时自动运行一次Python脚本,实现自动更新通知的目的。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
首先,需要编写一个cmd命令文件,方便在DOS框架下执行Python脚本。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
主要代码展示如下:tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
@echo off # 关闭回显 cd C:demo # 找到Python脚本文件的路径 python Python.py # 执行Python脚本文件**后,使用任务计划程序制定一个任务,可设定为每隔一小时自动运行一次cmd命令文件。tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
更多python进阶知识,请观看Python进阶视频教程!!tvE少儿编程网-Scratch_Python_教程_免费儿童编程学习平台
- 上一篇
用python可以做微信小程序吗?
简介其实微信小程序作为一个前端的机制,Python 并不能插上边。只不过可以作为后端接口为微信小程序提供数据服务而已。python可以做后端服务和小程序通讯,python可以写后端平台,提供api,微信小程序就用wx.request()调用这个api。微信小程序主要的三大块wxml控制页面结构
- 下一篇
python3爬虫入门:常用网络爬虫模块和技术
简介urllib模块urllib库是python中自带的模块,也是一个最基本的网络请求库,该模块提供了一个urlopen()方法,通过该方法指定URL发送网络请求来获取数据。urllib是一个收集了多个涉及URL的模块的包urllib.request打开和读取URL三行代码即可爬取百度首页源代码:imp