第5关：爬取单页多个div标签的信息

第5关：爬取单页多个div标签的信息 2022-11-09 864

任务描述

本关任务：改进上一关的代码。爬取湖南大学讲座网页的多个讲座信息，存储在二维列表jzxx中。湖南大学讲座信息的网址为

编程要求

根据提示，在右侧编辑器补充代码，爬取湖南大学讲座网页的多个讲座信息，存储在二维列表jzxx中。

开始你的任务吧，祝你成功！

import requests from bs4 import BeautifulSoup url = https://www.hnu.edu.cn/xysh/xshd.htm r = requests.get(url) r.encoding = utf-8 jzxx=[] #代码开始 soup = BeautifulSoup(r.text, "html.parser") lb = soup.find_all("div", class_="xinwen-wen") for i in lb: jzsj = i.find("div", class_= "xinwen-sj-top").text.strip() jzbt = i.find("div", class_= "xinwen-wen-bt").text.strip() jzdd = i.find("div", class_= "xinwen-wen-zy").text.strip() jzxx.append([jzsj,jzbt,jzdd]) #代码结束 f1=open("jzxx2.txt","w") for xx in jzxx: f1.write(",".join(xx)+" ") f1.close()

免费搭建微信查券返利机器人来轻松赚佣金

文章来自:IT技术分享网
分享地址:http://www.5ityx.cn/cate103/192904.html

上一篇： Java架构师技术进阶路线图

下一篇：网络安全行业需要工匠精神吗？

第5关：爬取单页多个div标签的信息

任务描述

相关知识

编程要求

聚合标签

第5关：爬取单页多个div标签的信息

任务描述

相关知识

编程要求

第5关：爬取单页多个div标签的信息 相关内容

聚合标签

第5关：爬取单页多个div标签的信息相关内容