公众号:uncle39py

V1

2022/08/17阅读:14主题:默认主题

爬虫基本功1:Http协议

爬虫基本功1:Http协议

一.Socket:套接字,

理解为插座,类比插座背后的电力体系已经建好了,不用管它,只要插上插座就可以通电;

我们使用套接字,就可以进行通信;而套接字后面的整套体系,操作系统以及各个硬件设备都已经实现,我们也不用费心;

IP:可以定位到服务器

port:可以定位到这台机器上的某个软件

通过socket获取到的数据是最原始的数据

二.Http协议

两个机器在通信的过程中,会通过大家约定好的"暗号",来发送消息.暗号对上了,才是自己人,才可以进行交接;这个"暗号"就是协议,当我们都遵循这个协议的规范来通信,互相就能知道对方请求和响应.

Chrome浏览器,按F12,可以打开调试工具;

HTTP协议的特点:

  • Http协议是客户端发起,服务端响应的

  • Http协议是一个无状态无连接的协议,第一次/第二次请求是没有关系的

  • Http协议是单向的

  • Http协议是纯文本的协议,这意味着我们直接传递纯文本即可;浏览器/服务器就是根据约定好的方法生成Http文本传给对方,然后双方都可以通过这个文本来解析出数据

Http协议的本质就是遵照某种格式来写的字符串

所以,只要拿到已经登陆的浏览器的cookies,就可以模拟Http请求,服务器就认为我们已经登陆了

下一章:爬虫基本功2:前端基础知识

分类:

后端

标签:

后端

作者介绍

公众号:uncle39py
V1