数据采集:selenium 提取 Cookie 自动登陆

写在前面


  • 工作需要,简单整理
  • 博文内容涉及 通过 selenium 实现自动登陆
  • 理解不足小伙伴帮忙指正

对每个人而言,真正的职责只有一个:找到自我。然后在心中坚守其一生,全心全意,永不停息。所有其它的路都是不完整的,是人的逃避方式,是对大众理想的懦弱回归,是随波逐流,是对内心的恐惧 ——赫尔曼·黑塞《德米安》


未登陆用户

保存 cookie

假设登陆用户名为 : chinaz_7356287

我们需要获取一些 CDN 的数据,代码很简单,不做说明,自动登陆 站长之家的 CDN 网站 https://cdn.chinaz.com/

from selenium import webdriver
import time
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
import re
import pandas as pd
import jsonbrowser = webdriver.Chrome()
browser.get("https://cdn.chinaz.com/")
time.sleep(4)
# 需要根据页面编写
browser.find_element(By.CSS_SELECTOR, ".userbar").find_element(By.TAG_NAME, "a").click()
print("等待登录...")
while True:try:time.sleep(10)# 需要根据页面编写 判断用户名是否存在if browser.find_element(By.CSS_SELECTOR,".username").text == "chinaz_7356287":print("已登录,保存 cookie...")with open('cookie.txt', 'w', encoding='u8') as f:json.dump(browser.get_cookies(), f) browser.close()print("cookie保存完成,游览器已自动退出...")else:time.sleep(3)except:passprint("登陆页面未出现,重试中")finally:pass        

获取到的 JSON 数据

[{"domain": ".chinaz.com","expiry": 1693423590,"httpOnly": false,"name": "chinaz_topuser","path": "/","sameSite": "Lax","secure": false,"value": "92da5ff9-69ac-c0b7-73ab-040cb089d48f"},{"domain": ".chinaz.com","expiry": 1693884390,"httpOnly": true,"name": "ucvalidate","path": "/","sameSite": "None","secure": true,"value": "9aba1eb9-8b70-019b-8352-43ff4719eb84"},{"domain": ".chinaz.com","httpOnly": false,"name": "Hm_lpvt_ca96c3507ee04e182fb6d097cb2a1a4c","path": "/","sameSite": "Lax","secure": false,"value": "1692588387"},{"domain": ".chinaz.com","expiry": 1724124387,"httpOnly": false,"name": "Hm_lvt_ca96c3507ee04e182fb6d097cb2a1a4c","path": "/","sameSite": "Lax","secure": false,"value": "1692588387"}
]

使用 cookie 自动登陆

from seleniumwire import webdriver
import json
import time# 自动登陆
browser = webdriver.Chrome()
with open('C:\\Users\山河已无恙\\Documents\GitHub\\reptile_demo\\demo\\cookie.txt', 'r', encoding='u8') as f:cookies = json.load(f)browser.get('https://cdn.chinaz.com/')
for cookie in cookies:browser.add_cookie(cookie)browser.get('https://cdn.chinaz.com/')time.sleep(10000)

以登陆用户

对于已经存在的用户,我们直接通过当前会话可以获取cookie 信息,然后直接替换对应的值

[{"domain": ".chinaz.com","expiry": 1693423590,"httpOnly": false,"name": "chinaz_topuser","path": "/","sameSite": "Lax","secure": false,"value": "92da5ff9-69ac-c0b7-73ab-040cb089d48f"},{"domain": ".chinaz.com","expiry": 1693884390,"httpOnly": true,"name": "ucvalidate","path": "/","sameSite": "None","secure": true,"value": "9aba1eb9-8b70-019b-8352-43ff4719eb84"},{"domain": ".chinaz.com","httpOnly": false,"name": "Hm_lpvt_ca96c3507ee04e182fb6d097cb2a1a4c","path": "/","sameSite": "Lax","secure": false,"value": "1692588387"},{"domain": ".chinaz.com","expiry": 1724124387,"httpOnly": false,"name": "Hm_lvt_ca96c3507ee04e182fb6d097cb2a1a4c","path": "/","sameSite": "Lax","secure": false,"value": "1692588387"}
]

控制台输入 console.log(document.cookie); 打印 cookie ,然后复制对应的 value 到上面的 JSON

console.log(document.cookie);VM64:1 toolUserGrade=DA558BECA59696EB6D6F7073658259093B6A1006BF1EE9768104ED4EF435DFFE7A7CCE826E9718B7BF5917ABBB8378EB9F2A2DF83F2D261B6ABB5FF77D3EB74948E7E207D35739840897873E9CED6A06188A7269E8D6621D2A3EB35366EE2939BD52587A8E5FD9CFD5B7FADCEA248B51B971062D27AB402FF41885786B87AD00; bbsmax_user=096a40c7-f2ba-8f87-f56a-bb8c65838157; chinaz_zxuser=c55d2eaa-e630-99a5-3d19-82c6cbadc2e3; Hm_lvt_ca96c3507ee04e182fb6d097cb2a1a4c=1692590966; Hm_lpvt_ca96c3507ee04e182fb6d097cb2a1a4c=1692590966; toolbox_urls=1.180.204.161|jiuzhoufangyuan.cn|daoxinwuliu.com|www.lzfjyl.com|lzfjyl.com|herunnongye.com|danyu.com.cn|www.danyu.com.cn|encrypt-k-vod.xet.tech; chinaz_topuser=f38f3b0f-4c0d-57d8-8f2d-35180d6e13a5

之后可以使用相同的方式登陆

博文部分内容参考

© 文中涉及参考链接内容版权归原作者所有,如有侵权请告知



© 2018-2023 liruilonger@gmail.com, All rights reserved. 保持署名-非商用-相同方式共享(CC BY-NC-SA 4.0)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/59833.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android JNI系列详解之CMake编译工具的使用

一、CMake工具的介绍 如图所示,CMake工具的主要作用是,将C/C编写的native源文件编译打包生成库文件(包含动态库或者静态库文件),集成到Android中使用。 二、CMake编译工具的使用 使用主要是配置两个文件:CM…

Ansible学习笔记12

playbook: playbook(剧本):是ansible用于配置、部署和管理被控节点的剧本,用于Ansible操作的编排。 使用的是yaml格式,(saltstack、elk、docker、docker-compose、k8s都会使用到yaml格式。&am…

快速入门学习记录:常用代码、特定函数、复杂概念和特定功能说明

😀前言 本篇博文是关于Java入门学习的一些常用记录,希望你能够喜欢 🏠个人主页:晨犀主页 🧑个人简介:大家好,我是晨犀,希望我的文章可以帮助到大家,您的满意是我的动力&a…

js对url进行编码解码(三种方式)

第一种:escape 和 unescape escape()不能直接用于URL编码,它的真正作用是返回一个字符的Unicode编码值 它的具体规则是,除了ASCII字母、数字、标点符号" * _ - . /"以外,对其他所有字符进行编码。在u0000到u00ff之间…

【模拟】算法实战

文章目录 一、算法原理二、算法实战1. leetcode1576 替换所有的问号2. leetcode495 提莫攻击3. leetcode6 N字形变换4. leetcode38 外观数列5. leetcode1419 数青蛙 三、总结 一、算法原理 模拟就是用计算机来模拟题目中要求的操作,模拟题目通常具有代码量大、操作…

Java稀疏数组

目录 1.稀疏数组 2.稀疏数组的使用 2.1 二维数组转换为稀疏数组 2.2 稀疏数组转换为二维数组 1.稀疏数组 稀疏数组(Sparse Array):当一个数组中的大部分元素为相同的值,可使用稀疏数组来保存该数组,可以将稀疏数组…

记录--怎么实现一个3d翻书效果

这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 本篇主要讨论以下两种翻书动画的实现: 第一种是整页翻转的效果: 这种整页翻转的效果主要是做rotateY的动画,并结合一些CSS的3d属性实现。 第二种折线翻转的效果&…

MATLAB不显示figure绘图窗口但保存图像的方案

MATLAB不显示figure绘图窗口但保存图像的方案,代码如下: % 生成数据 x linspace(0, 2*pi, 100); y1 sin(x); y2 cos(x); y3 sin(2*x);% 创建不可见的 Figure fig1 figure(Visible, off); plot(x, y1); title(Sine Curve); xlabel(X); ylabel(Y); s…

本文将介绍PHP中的数据类型

引言 在PHP中,与所有编程语言一样,数据类型用于对特定类型的数据进行分类。这一点很重要,因为你使用的特定数据类型将决定你可以给它赋什么值,可以对它做什么操作(包括可以对它执行什么操作)。 在本教程中,我们将介绍…

北京筑龙受邀出席中物联“采购供应链中国行—走进雄安”活动

日前,“采购供应链中国行—走进雄安”活动在河北雄安新区成功举办,来自30家相关单位的50余名领导和代表参加了本次活动。活动由中国物流与采购联合会公共采购分会主办,中国物流与采购联合会采购委、中国雄安集团有限公司、河北雄安新区招标投…

【数据结构】二叉数的存储与基本操作的实现

文章目录 🍀二叉树的存储🌳二叉树的基本操作🐱‍👤二叉树的创建🐱‍👓二叉树的遍历🎡前中后序遍历📌前序遍历📌中序遍历📌后续遍历 🛫层序遍历&am…

Java 8:Stream API 流式操作(学习)

Java 8:Stream API Java 8 中的 Stream API 是一组用于对集合数据进行处理的新特性;提供一种以声明式风格对集合进行操作的方式,简化集合的处理,使得代码更加简洁、优雅,并且能够更高效地处理数据; 这种风格…

商家必读:影响快递物流速度的这几个关键因素

在这个迅速发展的数字时代,消费者对于快速、高效的购物体验有着越来越高的期望。而作为商家,能否满足顾客对快递速度的要求将直接影响到商家的竞争力和业务发展。今天就和大家聊聊一个在电商行业中至关重要的话题——快递的物流速度对商家的重要性。 首…

leetcode做题笔记108. 将有序数组转换为二叉搜索树

给你一个整数数组 nums ,其中元素已经按 升序 排列,请你将其转换为一棵 高度平衡 二叉搜索树。 高度平衡 二叉树是一棵满足「每个节点的左右两个子树的高度差的绝对值不超过 1 」的二叉树。 思路一:模拟题意 struct TreeNode* inorder(int…

Linux——socket网络通信

一、什么是socket Socket套接字 由远景研究规划局(Advanced Research Projects Agency, ARPA)资助加里福尼亚大学伯克利分校的一个研究组研发。其目的是将 TCP/IP 协议相关软件移植到UNIX类系统中。设计者开发了一个接口,以便应用程序能简单地…

LeetCode 面试题 01.08. 零矩阵

文章目录 一、题目二、C# 题解 一、题目 编写一种算法,若M N矩阵中某个元素为0,则将其所在的行与列清零。 点击此处跳转题目。 示例 1: 输入: [ [1,1,1], [1,0,1], [1,1,1] ] 输出: [ [1,0,1], [0,0,0], [1,0,1] ] 示…

【RuoYi移动端】uniApp导入和引用uView2.0插件

一、打开uiew官网 安装 | uView 2.0 - 全面兼容 nvue 的 uni-app 生态框架 - uni-app UI 框架uView UI,是 uni-app 生态最优秀的 UI 框架,全面的组件和便捷的工具会让您信手拈来,如鱼得水https://uviewui.com/components/install.html 也可直…

大学生毕业设计论文题目大全-kaic

济南“樊然”主题餐厅设计莘县澄里甜品店设计聊城凤凰台星际电影公馆设计临沂市爱萌宠物医院设计定陶区云想衣服装店设计任城区曜龙休闲会所设计莘县衍界咖啡馆设计金乡啡尝嘢休闲吧设计聊城市皮肤病医院门诊设计禹城蜗牛书吧设计万达广场小乌托早教中心设计古城区栖居民宿设计…

hadoop大数据集群中更换磁盘,balance的速度缓慢问题(解决)

hadoop大数据集群中更换磁盘,balance的速度缓慢问题(解决) 看现象只有4个bloucks在执行的 调整参数: 增大配置参数,观察重新负载的速度 修改配置文件 hdfs-site.xml dfs.datanode.balance.max.concurrent.moves100 …