数据星辰

V1

2023/05/21阅读:9主题:橙心

模拟登录

模拟登录

一、网站的作用

  1. 许多网站的内容需要登录之后才能进行爬虫操作
  2. 对于需要登录的网站,网站和用户都不希望每打开一个新网页就需要重新登录一下, 所以就需要记录用户的登录状态信息
  3. 大多数新式网站都用Cookie跟踪用户是否已登录的状态信息
  4. 网站通过验证用户的登录权证,会将其保存在用户浏览器的Cookie中
  5. HTTP本身是无状态的,服务器需要利用Cookie保存登录信息
  6. 模拟登录是在每次发送请求时在请求的header中带上Cookie
  7. 网站会将这些Cookie作为信息验证的证据,在浏览网站的每个页面时出示给服务器

二、登录权证都包含什么呢?

  1. 服务器生成的令牌
  2. 登录有效时限
  3. 状态跟踪信息

三、Cookie

  1. Cookie有是也用其复数形式Cookies,指某些网站为了辨别用户身份、进行session跟踪而存储在用户本地终端上的数据(通常经过加密)
  2. Cookie是小量信息,是由Web服务器创建的,将信息存储在用户计算机上的文件

四、由于HTTP是一种无状态的协议,服务器单从网络连接上无从知道客户身份,应该怎么办?

就给客户端们颁发一个通行证吧,每人一个,无论谁访问都必须携带自己通行证。这样服务器就能从通行证上确认客户身份了。这就是Cookie的工作原理。

分类:

后端

标签:

后端

作者介绍

数据星辰
V1

数据星辰存储平台的搭建、分析、研究