
数据星辰
V1
2023/05/21阅读:9主题:橙心
模拟登录
模拟登录
一、网站的作用
-
许多网站的内容需要登录之后才能进行爬虫操作 -
对于需要登录的网站,网站和用户都不希望每打开一个新网页就需要重新登录一下, 所以就需要记录用户的登录状态信息 -
大多数新式网站都用Cookie跟踪用户是否已登录的状态信息 -
网站通过验证用户的登录权证,会将其保存在用户浏览器的Cookie中 -
HTTP本身是无状态的,服务器需要利用Cookie保存登录信息 -
模拟登录是在每次发送请求时在请求的header中带上Cookie -
网站会将这些Cookie作为信息验证的证据,在浏览网站的每个页面时出示给服务器
二、登录权证都包含什么呢?
-
服务器生成的令牌 -
登录有效时限 -
状态跟踪信息
三、Cookie
-
Cookie有是也用其复数形式Cookies,指某些网站为了辨别用户身份、进行session跟踪而存储在用户本地终端上的数据(通常经过加密) -
Cookie是小量信息,是由Web服务器创建的,将信息存储在用户计算机上的文件
四、由于HTTP是一种无状态的协议,服务器单从网络连接上无从知道客户身份,应该怎么办?
就给客户端们颁发一个通行证吧,每人一个,无论谁访问都必须携带自己通行证。这样服务器就能从通行证上确认客户身份了。这就是Cookie的工作原理。
作者介绍

数据星辰
V1
数据星辰存储平台的搭建、分析、研究