当前位置:首页 >知识 >【暗区突围GM服(Gm版)】利用爬虫代码美女写真套图下载转PDF保存

【暗区突围GM服(Gm版)】利用爬虫代码美女写真套图下载转PDF保存

2025-11-08 23:22:47 [焦点] 来源:鹰击毛挚网

爬的利用不是全站链接 ,该爬虫爬的爬虫暗区突围GM服(Gm版)是每套图的链接,相当于是代码暗区突围德古拉直装V2详情页的链接

需要单独下载的python库

【暗区突围GM服(Gm版)】利用爬虫代码美女写真套图下载转PDF保存

requests

fake_useragent

xpath

PIL

下面有图片 打码是为了过审,这网站真的美女暗区突围4指方案导入是正经的写真网站不是什么老司机网站

import requests from fake_useragent import UserAgent from lxml import etree import os import aiohttp import asyncio from PIL import Image import shutil #获取详情页全部图片函数 async def get_xq(url): #计数 p=0 tasks = [] res = requests.get(url=url,headers=header) res.encoding="utf-8" res.close() tree = etree.HTML(res.text) #图片标题 imgtitle = tree.xpath(//title/text())[0] global title title = imgtitle #第一页的图片链接 img = tree.xpath(//article//img/@src) imgurl = ["https://www.xgyw01.co" + i for i in img] print("当前下载的套图标题:\n"+imgtitle) for i in imgurl: p += 1 tasks.append(down(i,imgtitle,p)) #获取下一页的链接 next = "https://www.xgyw01.co" + tree.xpath(//div[@class="pagination"][1]//a[last()]/@href)[0] #判断的条件 bool = tree.xpath(//div[@class="pagination"][1]//a[last()]/text())[0] #循环获取所有页 while True: print("正在获取"+next) if bool == "下一页" or bool == "下页": res = requests.get(url=next, headers=header) res.encoding = "utf-8" res.close() tree = etree.HTML(res.text) img = tree.xpath(//article//img/@src) imgurl = ["https://www.xgyw01.co" + i for i in img] for i in imgurl: p += 1 tasks.append(down(i,imgtitle,p)) #判断的条件 bool = tree.xpath(//div[@class="pagination"][1]//a[last()]/text())[0] if bool == "下一页" or bool == "下页": next = "https://www.xgyw01.co" + tree.xpath(//div[@class="pagination"][1]//a[last()]/@href)[0] continue else: break else: break print("开始异步下载图片.....") await asyncio.wait(tasks) #下载函数 async def down(url,filename,fn): filepath = os.path.join(dirdz,filename) if not os.path.exists(filepath): os.mkdir(filepath) async with aiohttp.ClientSession() as session: async with session.get(url) as res: with open(filepath+"/"+str(fn)+".jpg",mode="wb") as f: f.write(await res.content.read()) print(f"第{fn}张下载完成") #写真图片转PDF函数 def jpg_pdf(filename): # 定义文件夹路径和PDF文件名 folder_path = os.path.join(dirdz,filename) pdf_filename = os.path.join(dirdz,filename + ".pdf") # # 将JPEG文件转换为Pillow Image对象并添加到列表中 image_files = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith(.jpeg) or f.endswith(.jpg)] image_list = [] for file_path in image_files: img = Image.open(os.path.abspath(file_path)) image_list.append(img) # 找到所有JPEG文件 image_list[0].save(pdf_filename, "PDF" ,resolution=100.0, save_all=True, append_images=image_list[1:]) print("pdf合并完成,删除缓存的的图片") shutil.rmtree(folder_path) print("清理完成") #主函数 if __name__ == __main__: #定义的公共请求头 header = {"user-agent": UserAgent().random} #定义的保存路径(文件夹路径) dirdz = "这里输入保存的文件夹路径" #定义一个全局的标题保存文件名字 title = "" #爬取的网站是:https://www.xgyw01.co/ ,找到想下的写真下载暗区突围M4A1平民改装方案套图直接点进去复制详情页的链接就行了 url = input("请输入套图详情页链接:") #使用异常捕获排除异常 try: #因为是异步函数所以需要用asyncio.run启动 asyncio.run(get_xq(url)) print(title) except: print("链接详情页解析错误.........") print("全部下载完成,开始生成pdf.......") #调用图片转PDF函数 jpg_pdf(title)

(责任编辑:百科)

    推荐文章
    • MTHEME模板网独家学习板苹果cms模板无加密

      MTHEME模板网独家学习板苹果cms模板无加密源码简介MTHEME模板网独家学习板苹果cms模板无加密。是一款基于苹果cms程序的一款全新的简洁好看UI的影视站模板类似于西瓜视频,不过同对比MxoneV10魔改模板来说功能没有那么多,也没有那么大 ...[详细]
    • 闪聊获取通讯录源码教程

      闪聊获取通讯录源码教程源码介绍闪聊获取通讯录源码教程环境Nginx+mysql5.6+php5.6+phpMyAdmin 搭建教程配置数据库路径 app/database.php宝塔站点伪静态设置为tphin ...[详细]
    • QQ名片生成php源码下载

      QQ名片生成php源码下载源码简介QQ名片生成php源码下载 ,里面的加密内容正是系统默认的QQ号,不过被作者那个加密了我也解不了 ,我已经把能删除的都删了 ,如果你们有实力可以解开就解吧,我就不把时间浪费在这上面了联系方式也没有要 ...[详细]
    • 10月最新彩虹易支付二开的浪子易支付系统

      10月最新彩虹易支付二开的浪子易支付系统源码简介10月最新彩虹易支付二开的浪子易支付系统更新日志2023/10/18:1.更新了首页模板3套2023/10/12 :1.新增邮件提醒功能,支持给用户发订单 、结算等邮件通知2.支持给管理员发送提现 ...[详细]
    • 最新商业版ChatGPT源码V4.8.6

      最新商业版ChatGPT源码V4.8.6源码简介最新商业版ChatGPT源码V4.8.6配置教程:第一步-配置APIKEY ,key去官网申请 ,也可以去买,懂的都懂第一步-配置数据库:lib/config.php第三步-导入数据库第四步-PH ...[详细]
    • EMLOG PRO后台暗黑模式插件,适配于EMLOG PRO的后台

      EMLOG PRO后台暗黑模式插件�,适配于EMLOG PRO的后台源码简介EMLOG PRO后台暗黑模式插件 ,适配于EMLOG PRO的后台暗黑模式插件 。适用于Emlog pro 版本2.1.12+功能说明实现对Emlog pro后台增加暗黑模式功能 ...[详细]
    • 宇柒云盘对接彩虹网盘iapp源码

      宇柒云盘对接彩虹网盘iapp源码源码介绍宇柒云盘iapp源码功能是对接彩虹网盘不懂的可以参考蓝奏网盘 , 1.宇柒云盘无需登陆注册即可上传, 2.单文件大小上限是200MB,3.支持在线预览图片,视 ...[详细]
    • 带动态背景视频APP下载页源码

      带动态背景视频APP下载页源码源码简介带动态背景视频APP下载页源码,可以二开修改做个人主页下载地址此处内容需要回复后才能查看 ...[详细]
    • 给博客添加炫酷流光文字CSS代码

      给博客添加炫酷流光文字CSS代码彩色流光文字HTML代码,添加到要展示的位置 ,在添加css就行了。<div class="text-style-1"> 小马博客 </div> ...[详细]
    • 在线人工智能对话机器人源码

      在线人工智能对话机器人源码源码介绍在线人工智能对话机器人源码,测试了一下就是对接的外部接口,无加密有能力的可以二开。使用教程 ,上传主机,服务器后解压使用 ,当然了 ,电脑解压后点击index.html也能用。下载地址 :此处内容需要 ...[详细]
    热点阅读