Python爬虫(七)--Scrapy模拟登录
http://www.jianshu.com/p/b7f41df6202d#
1. Cookie原理
HTTP是无状态的面向连接的协议, 为了保持连接状态, 引入了Cookie机制Cookie是http消息头中的一种属性,包括:
- Cookie名字(Name)Cookie的值(Value)
- Cookie的过期时间(Expires/Max-Age)
- Cookie作用路径(Path)
- Cookie所在域名(Domain),使用Cookie进行安全连接(Secure)。
前两个参数是Cookie应用的必要条件,另外,还包括Cookie大小(Size,不同浏览器对Cookie个数及大小限制是有差异的)。
2. 模拟登陆
首先查看登陆时的表单结果, 依然像前面使用的技巧一样, 故意输错密码, 方面抓到登陆的网页头部和表单(我使用的Chrome自带的开发者工具中的Network功能
)
文/Andrew_liu(简书作者)
原文链接:http://www.jianshu.com/p/b7f41df6202d#
著作权归作者所有,转载请联系作者获得授权,并标注“简书作者”。
原文链接:http://www.jianshu.com/p/b7f41df6202d#
著作权归作者所有,转载请联系作者获得授权,并标注“简书作者”。
评论
发表评论