Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

【识别】正则表达式 收集 #161

Open
adminpass opened this issue Jul 31, 2023 · 23 comments
Open

【识别】正则表达式 收集 #161

adminpass opened this issue Jul 31, 2023 · 23 comments
Labels
good first issue Good for newcomers

Comments

@adminpass
Copy link
Owner

adminpass commented Jul 31, 2023

V2.9.2 内置:E\d{1,4}|EP\d{1,4}|第\d{1,4}话|第\d{1,4}集|第\d{1,4}期|_\d{1,4}_|\d{1,4}\s|\[\d{1,4}\]|\d{1,4}-4K

image

@adminpass adminpass added the good first issue Good for newcomers label Jul 31, 2023
@adminpass adminpass pinned this issue Jul 31, 2023
@msycn
Copy link

msycn commented Jul 31, 2023

感谢更新,欢乐颂这种有3季 S01E\d{1,4},S02E\d{1,4}

@x1ao4
Copy link

x1ao4 commented Jul 31, 2023

希望可以让用户自定义正则表达式,或者再多提供一些选择。主要是即便是现在这个版本也有可能无法正确识别综艺节目。

当然你的软件的功能可能是识别正确的集数或期数,来命名对应的集数或期数。但是综艺节目的资源内容比较复杂,很多人订阅视频后需要在其他软件内进行刮削,所以需要正确的集数。

对于综艺节目来说,很多时候正确的期数并不是正确的集数。比如中国说唱巅峰对决 - 第 3 期下,如果想要正确的刮削,应该被名为中国说唱巅峰对决 - S02E06,通过之前的版本,我们可以通过过滤不要的集(加更、花絮),然后把正片顺序命名,不通过识别序号的方式来实现命名为正确的集数。

但有一种情况是,资源的期数不完整,因为现在规则似乎都是从1开始命名的,也没有办法指定起始集数,所以如果期数不完整,或者有中断,就无法实现正确命名,包括中途订阅的情况,也会出现一些问题。

当无法从视频标题获取正确的集数时,还有一种解决方案,是使用日期命名。比如20230731 - 第55期,重命名为2023-07-31 - 第55期就可以正常刮削识别,但如果要用SE命名,实际上这一期应该是S01E61

使用日期命名的好处是不需要转换期数,但有些综艺节目一天更新上下集的,就还是需要使用SE命名。

综艺节目比较复杂,所以还是希望可以增加一个用户自定义正则表达式,或者添加一些指定起始集数或者日期正则的命名方式。

最后感谢大佬的付出。

@XlangNan
Copy link

XlangNan commented Aug 1, 2023

大佬 我发现{}替换序号的方式失败了,比如我订阅的事16 4K这种 就完全识别错误了。

@XlangNan
Copy link

XlangNan commented Aug 1, 2023

我感觉最好的方法就是让我们自己去设置表达式,比如18 4K这种名称,我们可以设置序号的字符的位置,这样的名称可以让我们设置 从名称第几个字符开始取 取几个字符。

@adminpass
Copy link
Owner Author

adminpass commented Aug 1, 2023

我感觉最好的方法就是让我们自己去设置表达式,比如18 4K这种名称,我们可以设置序号的字符的位置,这样的名称可以让我们设置 从名称第几个字符开始取 取几个字符。

V2.9.2版支持自定义正则,直接 E 不要用 E{},正则如:\d{1,4}\s -> 16 4K.mp4 \d{1,4}-4K -> 16-4K.mp4

@XlangNan
Copy link

XlangNan commented Aug 1, 2023

可是我想要的最终名称 是 长相思S01E16 这种格式,我预设名称写的是 长相思S01E 这样,遇到16 4K这种 就会识别成 长相思S0116 4K这样。

@XlangNan
Copy link

XlangNan commented Aug 2, 2023

我明白了 感谢大佬

@StanleyLovebass
Copy link

蹲求动画正则表达式~原始命名如下:[orion origin] Rurouni Kenshin:Meiji Kenkaku Romantan [04] [1080p] [H265 AAC] [CHS&JPN]

@Makerlong
Copy link

希望可以支持单个视频独立支持的正则,有一些写出来会导致其他的出现问题。

@msycn
Copy link

msycn commented Aug 6, 2023

希望支持 4k和1080p自动识别重命名,看到大佬现在已经支持显示元数据

@adminpass
Copy link
Owner Author

蹲求动画正则表达式~原始命名如下:[orion origin] Rurouni Kenshin:Meiji Kenkaku Romantan [04] [1080p] [H265 AAC] [CHS&JPN]

试下:[\d{1,4}]

@StanleyLovebass
Copy link

蹲求动画正则表达式~原始命名如下:[orion origin] Rurouni Kenshin:Meiji Kenkaku Romantan [04] [1080p] [H265 AAC] [CHS&JPN]

试下:[\d{1,4}]

感谢,但是这个识别出来是S01E00

@adminpass
Copy link
Owner Author

蹲求动画正则表达式~原始命名如下:[orion origin] Rurouni Kenshin:Meiji Kenkaku Romantan [04] [1080p] [H265 AAC] [CHS&JPN]

试下:[\d{1,4}]

感谢,但是这个识别出来是S01E00

\[\d{1,4}\] 前面有个 \ 发出来丢了

@x1ao4
Copy link

x1ao4 commented Aug 9, 2023

看到新版支持自定义正则表达式了,但是搞不明白这个正则的规则,我想把20230807-第56期_Tacit0924重命名为2023-08-07-第56期_Tacit09242023-08-07 第56期2023-08-07,似乎这里的正则只能捕获序号不能捕获年月日,我尝试使用\d{4}\d{2}\d{2}或者(\d{4})(\d{2})(\d{2})或者2023\d{2}\d{2}都不行,因为我之前接触的正则表达式都是有原标题的表达式和替换标题的表达式,然后进行替换标题的,但是这里的正则表达式似乎只是捕获标题中的序号,我想把日期作为一个序号捕获,但是日期是8位连续数字,不知道应该如何捕获,并且我需要把捕获的年月日用-隔开,不知道有没有办法实现。

@x1ao4
Copy link

x1ao4 commented Aug 11, 2023

我感觉最好的方法就是让我们自己去设置表达式,比如18 4K这种名称,我们可以设置序号的字符的位置,这样的名称可以让我们设置 从名称第几个字符开始取 取几个字符。

V2.9.2版支持自定义正则,直接 E 不要用 E{},正则如:\d{1,4}\s -> 16 4K.mp4 \d{1,4}-4K -> 16-4K.mp4

大佬,你把{}命名整没了是吗?现在订阅标题中不包含正确集数的就没法自动命名了,原来还可以用{}顺序命名,现在也不行了,希望把E{}这个方法恢复。比如下面的:

20230811-第1期下_Tacit0924.mp4
20230811-第1期上_Tacit0924.mp4
20230811-先导片_Tacit0924.mp4

以前我过滤掉先导,保存名称设置为乐队的夏天 - S03E{}可以重命名为:

20230811-第1期下_Tacit0924.mp4 > 乐队的夏天 - S03E02
20230811-第1期上_Tacit0924.mp4 > 乐队的夏天 - S03E01

现在S03E{}用不成了,第1期提取序号这种对这个类节目不适用,这种综艺就没法自动重命名了。


哦,我误会了,其实乐队的夏天 - S03E{}这个还是有效的,但是有个 BUG 是预览里面没有显示正确的命名,订阅以后实际上效果和以前一样。

1

@msycn
Copy link

msycn commented Aug 11, 2023

我感觉最好的方法就是让我们自己去设置表达式,比如18 4K这种名称,我们可以设置序号的字符的位置,这样的名称可以让我们设置 从名称第几个字符开始取 取几个字符。

V2.9.2版支持自定义正则,直接 E 不要用 E{},正则如:\d{1,4}\s -> 16 4K.mp4 \d{1,4}-4K -> 16-4K.mp4

大佬,你把{}命名整没了是吗?现在订阅标题中不包含正确集数的就没法自动命名了,原来还可以用{}顺序命名,现在也不行了,希望把E{}这个方法恢复。比如下面的:

20230811-第1期下_Tacit0924.mp4
20230811-第1期上_Tacit0924.mp4
20230811-先导片_Tacit0924.mp4

以前我过滤掉先导,保存名称设置为乐队的夏天 - S03E{}可以重命名为:

20230811-第1期下_Tacit0924.mp4 > 乐队的夏天 - S03E02
20230811-第1期上_Tacit0924.mp4 > 乐队的夏天 - S03E01

现在S03E{}用不成了,第1期提取序号这种对这个类节目不适用,这种综艺就没法自动重命名了。

同样问题,不仅新的无法重命名,已经在订阅的还会重复收藏一遍原文件

@x1ao4
Copy link

x1ao4 commented Aug 11, 2023

同样问题

这个我测试了,他是有个 BUG,预览的时候没有显示正确的名字,实际上我订阅以后还是和以前一样,按想要的方式命名成功了,重复收藏原文件的情况,其实一般我订阅链接失效或怎么样需要重新订阅的时候,我会先重置,就是先清空以前所有保存的记录,重新刷新,这样就不存在重复文件的情况了。

@wdzzz
Copy link

wdzzz commented Aug 15, 2023

建议过滤里面直接添加文件大小选项,然后按顺序编号。。基本能排除综艺里杂七杂八的花絮。。

@lustlost
Copy link

可以考虑使用chatgpt来自动识别和生成正确的名字
image

@wunyee
Copy link

wunyee commented Jan 10, 2024

大佬 这种有空格才是集数的正则该如何订?
1080p.H264 088.mp4

@metaforget
Copy link

看了一下,这个正则表达式不只是识别筛选文件名,还有重命名功能吗?但是我不太清楚重命名是什么逻辑,作者能不能说说这个。我现在保存格式就一个E,有的会转个名字,有的是原名保存

@Lome11
Copy link

Lome11 commented Dec 7, 2024

综艺名称的修改提个建议,可以把年月日中月日当剧集,比如"20241013第1期李沐宸霸气强吻看呆宁静.mkv",那么就显示"2024.E1013.第1期李沐宸霸气强吻看呆宁静.mkv" ,剧集就和综艺节目的日期名称相对应.
image
image

@x1ao4
Copy link

x1ao4 commented Dec 13, 2024

综艺名称的修改提个建议,可以把年月日中月日当剧集,比如"20241013第1期李沐宸霸气强吻看呆宁静.mkv",那么就显示"2024.E1013.第1期李沐宸霸气强吻看呆宁静.mkv" ,剧集就和综艺节目的日期名称相对应. image image

你这样是错误的命名方式,这样命名以后无法按照 TMDB 刮削剧集信息(可以刮削节目信息)。综艺节目目前的正确使用方式是,正片和非正片分开订阅,以正片为例,保存格式例如 声生不息 - S04E{},设置过滤词 发布会,先导篇,超前营业,加更,纯享,这样剩余的资源就全是正片,并且会按播出顺序按照 声生不息 - S04E01声生不息 - S04E02声生不息 - S04E03 这样依序自动命名。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
good first issue Good for newcomers
Projects
None yet
Development

No branches or pull requests