python测试url是否可访问,网站是否连通的方法
前言
一般这种方法用在校验 比如
-
前端界面传回后端的url,如果返回值不是200,不保存其值 调用的接口不通,直接返回非200 爬虫网站,验证url是否可爬取等信息
1. requests库
讲解实战方法之前,先科普下基本的知识点
该代码为requests而不是request(注意区分) 导入的时候通过import requests
通过requests库获取url 获取得到的值赋值给response对象:res = requests.get(url)
requests的Http请求类型(get、post、put、delete等)都可返回一个response对象
url = https://blog..net/weixin_47872288 res = requests.get(url) res = requests.post(url) res = requests.put(url) res = requests.delete(url) res = requests.head(url) res = requests.options(url)
1.1 传参
经常看到一些网站都是key=value或者/value传参 (在java中类似restful等格式: )
如果传入key value通过requests的HTTP请求类型获取,传入字典、列表、元祖类型等 具体格式如下:
# 字典传输 # https://blog..net/weixin_47872288?key=value param = { key: value} res = requests.get("https://blog..net/weixin_47872288", param=param) # 单个key 多个value(传入列表) # https://blog..net/weixin_47872288?key1=value1&key2=value2&key2=value3&key2=value4 param = { key1: value1,key2: [value2, value3, value4]}} res = requests.get("https://blog..net/weixin_47872288", param=param)
1.2 响应内容
关于响应内容具体都有这些方法,通过这些方法取出想要的数据信息:
大致示例代码如下:
res = requests.get(url) try : logger.info(res.raise_for_status()) except requests.exceptions.HTTPError as err: logger.info(err) logger.info(res.status_code) logger.info(res.apparent_encoding) logger.info(res.ok)
如果url或者接口不可访问的时候,输出值为:
404 Client Error: Not Found 404 ascii False
讲解一下这个函数:res.raise_for_status(),主要与异常绑定在一起,如果response返回值非200,返回一个HTTPError,返回值200则内容正确(判定网络是否可正常连接)
2. python web
结合python web实战开发 通过前端form表单传进的数据(获取其url值)
def save_data(self, request, form): # 通过获取url接口 port = form.cleaned_data[port] # 由于没有http,通过拼接 url = "http://" + port # 定义响应头文文件 headers = { "Content-Type": "application/json"} # 通过requests库 res = requests.get(url=url, headers=headers) # 如果返回值非200 则跳出该函数返回false if res.status_code != 200: return False # 接口测试成功,则继续执行以下代码
如果url返回不是200,则form表单无法进行保存