【南+论剑】悬赏1777sp，进来分享你的开车技巧/网站/工具| 茶楼| 茶馆 - 南+ South Plus

苍狼望月

B372F 2021-01-30 08:06

mark

| ▼展开

只看该作者 | | 小中大

axaxax

B373F 2021-01-30 08:17

| ▼展开

只看该作者 | | 小中大

SilverM

B374F 2021-01-30 14:01

（御姐控，熟女控，年上控，爱后宫也爱纯爱，爱人外也爱触手丸吞）

只看该作者 | | 小中大

有意思，不知道有没有下青年漫和杂志的

顶端

d5ec971d

B375F 2021-01-30 14:17

只看该作者 | | 小中大

好贴

顶端

なまえ知らず

B376F 2021-01-30 14:20

只看该作者 | | 小中大

引用
引用第215楼a99ff868于2021-01-24 12:09发表的 :
虽然我注册南＋的时间比较晚，但还是得贡献一份绵薄之力的
首先是下载工具，本人百度网盘开的包月超会，磁链就用破解迅雷或者比特彗星下载，115买不起，害迅雷链接在下方
链接：https://pan.baidu.com/s/1j-0RVbUcQUCuDPklGNCoZg
提取码：2133 解压码213331
至于网站我还是p站，xvideos，javbus，喵绅士用的较多一点，
.......

我买的3SP 但是扣了我1777 能否归还下

此帖售价 5 SP币,已有 1 人购买

若发现会员采用欺骗的方法获取财富,请立刻举报,我们会对会员处以2-N倍的罚金,严重者封掉ID!

顶端

无所畏惧

B377F 2021-01-30 21:55

mark

| ▼展开

只看该作者 | | 小中大

纯洁的lsp

B378F 2021-01-30 22:24

马克

| ▼展开

只看该作者 | | 小中大

kujisanfun

B379F 2021-01-31 02:39

（cc）

只看该作者 | | 小中大

更新一下吧，关于下载缺失的情况
特别注意，这不是对之前的爬虫的更新，而是另外一个全新的爬虫，请先使用第一个下载，再用这个补全

说明：
原楼层写太多了，新写一楼
想来想去还是补救一下，重新下载还是麻烦，况且每次下载完就要确认缺失情况，否则还得回头找链接，太麻烦
在漫画名后面添加id=和page=也是预留了补救措施

exe文件：
链接:https://pan.baidu.com/s/1YzrOuHzp582dEW2JSxdJcw 提取码:q994 复制这段内容后打开百度网盘手机App，操作更方便哦

先放代码

复制代码

import os
import shutil
import requests
import threading
from faker import Faker
faker = Faker(locale='zh_CN')
glock = threading.Lock() #加锁
def save_img_noreferer(path,src):
headers = {
'User-Agent':faker.user_agent()
}
try:
response = requests.get(src,headers=headers)
except:
save_img_noreferer(path,src)
else:
if response.status_code == 200: #状态码200，正常下载
with open(path,'wb') as f:
f.write(response.content)
print(path+'下载完成')
elif response.status_code == 522: #状态码522，超时重新下载，直至200下载成功
save_img_noreferer(path,src)
elif response.status_code == 404: #状态码404大概是格式后缀错误，改默认jpg为png
src = src.replace('jpg','png')
save_img_noreferer(path,src)
else:
print(src+'，下载失败，网页状态码为：'+str(response.status_code))
with open('常用的/error.txt','a',encoding='utf8') as f:
f.write(src+'，下载失败，网页状态码为：'+str(response.status_code)+'\n')
def save_imgs(k,v): #多线程,配合save_img_noreferer()使用
while True:
glock.acquire()
if len(k) ==0:
glock.release()
break
else:
path = k.pop()
url = v.pop()
glock.release()
save_img_noreferer(path,url)
def get_path_files(path):
ls_path_files = []
for i in os.walk(path):
ls_path_files.append(i[0])
del ls_path_files[0]
return ls_path_files
def get_dict_path_url(ls_path_files):
path = []
url = []
for path_file in ls_path_files:
page_should = int(path_file.split('page=')[-1]) #完整页码数
page_actually = len(os.listdir(path_file)) #实际页码数
if page_should == page_actually:
pass
else: #两者不相等说明缺失
num = path_file.split('id=')[-1].split('page=')[0]
ls_page_actually = []
for i in os.listdir(path_file):
ls_page_actually.append(int(i.split('.')[0]))
for i in range(1,page_should+1):
if i not in ls_page_actually: #对于缺失的，添加其本地路径和图片地址
img_name = str(i)+'.jpg'
path.append(os.path.join(path_file,img_name))
url.append('https://i0.nyacdn.com/galleries/'+num+'/'+img_name)
return dict(zip(path,url)) #返回本地路径:图片地址的字典
def ctrl_x(path_old,path_new):
try:
shutil.move(path_old,path_new)
except:
with open('常用的/error.txt','w',encoding='utf8') as f:
f.write('剪切时发生出错\t'+path_old)
def main():
path = input('请输入二级路径:')
ls_path_files = get_path_files(path) #获取二级路径下各一级路径
dict_path_url = get_dict_path_url(ls_path_files) #获取本地路径:图片地址的字典
if len(dict_path_url) == 0:
input('未发现有缺失，按任意键退出')
elif len(dict_path_url) <= 10: #缺失小于等于10页，可能完全不能下载，用户选择
a = input('缺失'+str(len(dict_path_url))+'，可能不能下载了，是否继续处理(y)')
if a == 'y': #多线程下载
k = list(dict_path_url.keys())
v = list(dict_path_url.values())
for _ in range(64):
consumer = threading.Thread(target=save_imgs,args=[k,v,])
consumer.start()
else: #缺失大于10页，以我检验4W+缺失的经历，应该不会超过10页，故自动补全
k = list(dict_path_url.keys())
v = list(dict_path_url.values())
for _ in range(64):
consumer = threading.Thread(target=save_imgs,args=[k,v,])
consumer.start()
if __name__ == '__main__':
main()

用了os.walk()，老实说好用也不好用，反正我第一次用的时候过了很久才熟悉
其余看注释

使用说明：
①双击打开exe，等下如下图出现

②按照提示复制粘贴二级路径，（我对二级路径的定义是这样的：包含众多图片、文件夹名为漫画名的文件夹的路径叫一级路径。而包含大量一级路径文件夹的叫二级路径）（我不知道应该怎么叫，就这么解释，姑且贴个图，语文不好，见谅）（如果你下载了一本本漫画后没有做什么其他处理的话，那么这个二级路径应该是“D:\本子”）

记得回车开始
③有三种情况处理：
1）不缺失，会提示“未发现有缺失，按任意键退出”
2）缺失小于等于10页，会询问你要不要继续，当且仅当输入y继续，否则不做处理，处理完自动退出
3）如果大于10页，不做询问自动处理，处理完自动退出

注意：
①存在缺失完全不能下载的情况，我测试的时候是4W+不超过10页，所以阈值设的10
②程序自动退出是bug了还是，完成了，请再是一遍，理想情况下要么提示不缺失，要么提示缺失小于等于10
③如有问题请仔细阅读使用说明，仍不能解决请私信问题
④对于二级路径再次说明：二级路径是包含众多漫画的文件夹，漫画的文件夹下只能包含图片。否则可能会出现未知错误，对此问题不更新

顶端

战场原

B380F 2021-01-31 03:03

| ▼展开

只看该作者 | | 小中大

战场原

B381F 2021-01-31 03:03

| ▼展开

只看该作者 | | 小中大

godhand

B382F 2021-01-31 03:08

mark

| ▼展开

只看该作者 | | 小中大

银河中的天

B383F 2021-01-31 03:09

mark

| ▼展开

只看该作者 | | 小中大

铁血LXO

B384F 2021-01-31 03:11

mark

| ▼展开

只看该作者 | | 小中大

1896ba4d

B385F 2021-01-31 13:47

只看该作者 | | 小中大

mark！

顶端

映落晓

B386F 2021-01-31 17:24

（天の道を行き総てを司る）

只看该作者 | | 小中大

可惜啊，这个好少啊

顶端

charaznable

B387F 2021-02-03 04:00

只看该作者 | | 小中大

mark

顶端

harrywu96

B388F 2021-02-03 10:40

mark

| ▼展开

只看该作者 | | 小中大

闲人1943

B389F 2021-02-03 11:42

（血肉苦弱，机械飞升）

只看该作者 | | 小中大

顶顶，围观大佬

顶端

罪溺

B390F 2021-02-03 12:11

mark

| ▼展开

只看该作者 | | 小中大

65075a53

B391F 2021-02-03 12:19

| ▼展开

只看该作者 | | 小中大

1421867117

B392F 2021-02-03 12:51

mark

| ▼展开

只看该作者 | | 小中大

新世纪复读机

B393F 2021-02-03 13:50

mark

| ▼展开

只看该作者 | | 小中大

....

B394F 2021-02-03 14:30

mark

| ▼展开

只看该作者 | | 小中大

35e1f6b5

B395F 2021-02-03 16:19

只看该作者 | | 小中大

mark 研究

顶端

欧力给999

B396F 2021-02-03 17:00

mark

| ▼展开

只看该作者 | | 小中大

886c84ca

B397F 2021-02-03 17:02

只看该作者 | | 小中大

翻墙草榴社区解决一切

顶端

不破爱花

B398F 2021-02-05 01:46

只看该作者 | | 小中大

这个要MARK一下了

顶端

画风即正义

B399F 2021-02-05 02:40

（电子阳痿）

只看该作者 | | 小中大

图片：

分享一个我自己为了自己用起来方便用翻译软件和自己对功能的理解翻译的一个韩国人开发的视频本子下载工具
汉化是2.6几的时候做的现在软件3.*了但是界面并没有太改，软件也用熟练了…所以没有后续接着弄

https://github.com/KurtBestor/Hitomi-Downloader

不会弄附件就不弄了

顶端