本地电影刮削与整理一体化解决方案
Go to file
2020-02-14 18:46:11 +08:00
readme Delete readme5.png 2019-11-04 08:18:09 +08:00
.gitignore Initial commit 2019-05-26 19:24:22 +08:00
ADC_function.py 2.1 2020-01-21 01:20:40 +08:00
AV_Data_Capture.py Update 2.6 2020-02-14 18:46:11 +08:00
avsox.py Update 2.5 2020-02-04 01:02:51 +08:00
config.ini 2.3-添加排除目录 2020-01-29 14:28:30 +08:00
core2.py Update 2.6 2020-02-14 18:46:11 +08:00
core.py Update 2.6 2020-02-14 18:46:11 +08:00
fanza.py Update 2.5 2020-02-04 01:02:51 +08:00
fc2fans_club.py Update 2.5 2020-02-04 01:02:51 +08:00
javbus.py Update 1.8 2019-12-15 20:30:20 +08:00
javdb.py Update 2.5 2020-02-04 01:02:51 +08:00
LICENSE Update LICENSE 2019-10-27 16:28:51 +08:00
README.md Update README.md 2020-02-09 17:48:34 +08:00
siro.py Update 2.5 2020-02-04 01:02:51 +08:00
update_check.json Update 2.6 2020-02-14 18:46:11 +08:00

AV Data Capture (CLI)

CLI版本

GUI版本

日本电影元数据 抓取工具 | 刮削器配合本地影片管理软件EMBY,KODI等管理本地影片该软件起到分类与元数据抓取作用利用元数据信息来分类供本地影片分类整理使用本地电影刮削整理一体化解决方案。

目录

声明

  • 本软件仅供技术交流,学术交流使用
  • 本软件作者编写出该软件旨在学习Python3提高编程水平
  • 用户在使用该软件前,请用户自觉遵守当地法律法规,如果该软件使用过程中存在违反当地法律法规的行为,请勿使用该软件
  • 用户使用该软件时,若产生一切违法行为由用户承担
  • 严禁用户使用于商业和个人其他意图
  • 本软件作者保留最终决定权和最终解释权

若用户不同意上述条款任意一条,请勿使用该软件

FAQ

这软件能下片吗?

  • 该软件不提供任何影片下载地址,仅供本地影片分类整理使用。

什么是元数据?

  • 元数据包括了影片的:封面,导演,演员,简介,类型......

软件收费吗?

  • 软件永久免费。除了作者钦点以外

软件运行异常怎么办?

为什么程序要单线程运行?

如果多线程爬取会触发网站反爬机制,而且也违背了些道德,故单线程运行

故事

点击跳转至作者博客文章

效果图

图片来自网络,由于相关法律法规,具体效果请自行联想

如何使用

下载

  • release的程序可脱离python环境运行,可跳过 模块安装
    Release 下载地址(仅限Windows):

  • Linux,MacOS请下载源码包运行

  • Windows Python环境:点击前往 选中executable installer下载

  • MacOS Python环境点击前往

  • Linux Python环境Linux用户懂的吧不解释下载地址

简要教程:

1.把软件拉到和电影的同一目录
2.设置ini文件的代理路由器拥有自动代理功能的可以把proxy=后面内容去掉)
3.运行软件等待完成
4.把JAV_output导入至KODI,EMBY中。
详细请看以下教程

1.模块安装

如果运行源码版,运行前请安装Python环境和安装以下模块
在终端/cmd/Powershell中输入以下代码来安装模块

pip install requests

pip install pyquery

pip install lxml

pip install Beautifulsoup4

pip install pillow

2.配置config.ini

运行模式

[common]
main_mode=1

1为普通模式
2为整理模式仅根据女优把电影命名为番号并分类到女优名称的文件夹下

failed_output_folder=failed
success_output_folder=JAV_outputd

设置成功输出目录和失败输出目录


软链接

方便PT下载完既想刮削又想继续上传的仓鼠党同志

[common]
soft_link=0

1为开启软链接模式
0为关闭


网络设置

[proxy]
proxy=127.0.0.1:1081
timeout=10
retry=3

针对某些地区的代理设置

proxy=127.0.0.1:1081

打开config.ini,在[proxy]下的proxy行设置本地代理地址和端口支持Shadowxxxx/X,V2XXX本地代理端口
素人系列抓取建议使用日本代理
路由器拥有自动代理功能的可以把proxy=后面内容去掉
本地代理软件开全局模式的用户同上
如果遇到tineout错误可以把文件的proxy=后面的地址和端口删除,并开启代理软件全局模式,或者重启电脑,代理软件,网卡


连接超时重试设置

timeout=10

10为超时重试时间 单位:秒


连接重试次数设置

retry=3

3即为重试次数


检查更新开关

[update]
update_check=1

0为关闭1为开启不建议关闭


媒体库选择

[media]
media_warehouse=emby
#emby plex kodi

可选择emby, plex, kodi
如果是PLEX请安装插件XBMCnfoMoviesImporter


排除指定字符和目录

[escape]
literals=\
folders=failed,JAV_output
literals= 标题指定字符删除,例如iterals=\(),删除标题中\()字符
folders= 排指定目录,例如folders=failed,JAV_output多目录刮削时跳过failed,JAV_output


调试模式

[debug_mode]
switch=1

如要开启调试模式,请手动输入以上代码到config.ini中,开启后可在抓取中显示影片元数据


3.(可选)设置自定义目录和影片重命名规则

[Name_Rule]
location_rule=actor+'/'+number
naming_rule=number+'-'+title

已有默认配置


命名参数

title = 片名
actor = 演员
studio = 公司
director = 导演
release = 发售日
year = 发行年份
number = 番号
cover = 封面链接
tag = 类型
outline = 简介
runtime = 时长

上面的参数以下都称之为变量

例子:

自定义规则方法:有两种元素,变量和字符,无论是任何一种元素之间连接必须要用加号 + ,比如:'naming_rule=['+number+']-'+title,其中冒号 ' ' 内的文字是字符,没有冒号包含的文字是变量,元素之间连接必须要用加号 +
目录结构规则:默认 location_rule=actor+'/'+number
不推荐修改时在这里添加title有时title过长因为Windows API问题抓取数据时新建文件夹容易出错。
影片命名规则:默认 naming_rule=number+'-'+title
在EMBY,KODI等本地媒体库显示的标题不影响目录结构下影片文件的命名,依旧是 番号+后缀。


更新开关

[update]
update_check=1

1为开0为关

4.多目录影片处理

可以在多个有影片目录的父目录下搜索影片后缀,然后剪切到和程序同一目录下

多集影片处理

可以把多集电影按照集数后缀命名为类似ssni-xxx-cd1.mp4m,ssni-xxx-cd2.mp4abp-xxx-CD1.mp4的规则,只要含有-CDn./-cdn.类似命名规则,即可使用分集功能

5.运行 AV_Data_capture.py/.exe

当文件名包含:
中文,字幕,-c., -C., 处理元数据时会加上中文字幕标签

5.1 异常处理(重要)

请确保软件是完整地确保ini文件内容是和下载提供ini文件内容的一致的


关于软件打开就闪退

可以打开cmd命令提示符AV_Data_capture.py/.exe拖进cmd窗口回车运行查看错误出现的错误信息依据以下条目解决


关于 Updata_checkJSON 相关的错误

跳转 网络设置


关于字幕文件移动功能

字幕文件前缀必须与影片文件前缀一致,才可以使用该功能


关于FileNotFoundError: [WinError 3] 系统找不到指定的路径。: 'JAV_output''

在软件所在文件夹下新建 JAV_output 文件夹,可能是你没有把软件拉到和电影的同一目录


关于连接拒绝的错误

请设置好代理


关于Nonetype,xpath报错

同上


关于番号提取失败或者异常

目前可以提取元素的影片:JAVBUS上有元数据的电影素人系列:300Maan,259luxu,siro等,FC2系列

下一张图片来自Pockies的blog 原作者已授权

目前作者已经完善了番号提取机制,功能较为强大,可提取上述文件名的的番号,如果出现提取失败或者异常的情况,请用以下规则命名

COSQ-004.mp4

条件:文件名中间要有下划线或者减号"_","-",没有多余的内容只有番号为最佳,可以让软件更好获取元数据 对于多影片重命名,可以用ReNamer来批量重命名


关于PIL/image.py

暂时无解可能是网络问题或者pillow模块打包问题你可以用源码运行要安装好第一步的模块

拖动法

针对格式比较奇葩的番号
影片放在和程序同一目录下,拖动至AV_Data_Capture.exe,即可完成刮削和整理

6.软件会自动把元数据获取成功的电影移动到JAV_output文件夹中根据演员分类失败的电影移动到failed文件夹中。

7.把JAV_output文件夹导入到EMBY,KODI中等待元数据刷新完成

8.关于群晖NAS

开启SMB在Windows上挂载为网络磁盘即可使用本软件也适用于其他NAS

9.写在后面

怎么样,看着自己的日本电影被这样完美地管理,是不是感觉成就感爆棚呢?
tg官方电报群: 点击进群