Python网络爬虫入门版笔记 一、HTTP协议

HTTP协议

一、什么是HTTP

HTTP:Hypertext Transfer Protocol,超文本传输协议 http协议是基于“请求与响应“模式的、无状态的应用层协议。采用URL作为定位网络资源的标识。 无状态指的是本次请求与下一次请求并没有关联。应用层指的是,该协议工作在TCP协议之上。 URL可以理解为文件资源的Internet路径。

二、HTTP的作用

http拥有对资源进行操控的方法,主要有以下:

方法 说明 GET 请求URL位置的资源 HEAD 请求URL位置资源的响应消息报告,即获得该资源的头部信息 POST 请求向URL位置的资源后附加新的数据 PUT 请求向URL位置存储一个资源,覆盖原URL位置的资源 PATCH 请求局部更新URL位置的资源,即即改变该处资源的部分内容 DELETE 请求删除URL位置存储的资源

上方的六个方法实际上就是Requests库主要的六个方法所提供的功能。 分别对应:

    requests.get() requests.head() requests.post() requests.put() requests.patch requests.delete()

上述方法在实际执行时并没有想象中的那么傻瓜,以requests.post()方法为例,在向服务器发送数据时,post方法会自动根据数据内容对数进行分类和处理,从而将数据放入服务器中的不同分区。

总结来说,HTTP协议通过URL对网络上的资源做定位,通过六个方法对资源进行操作,每一次操作都是独立无关联的。

经验分享 程序员 微信小程序 职场和发展