找回密码
 立即注册
查看: 461|回复: 4

Nfo Scraper:一款免改名的半自动媒体刮削器

  • TA的每日心情
    擦汗
    2024-2-1 09:11
  • 签到天数: 2 天

    [LV.1]初来乍到

    1

    主题

    3

    回帖

    0

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    8018
    askjhas 发表于 2024-4-22 23:22:28 | 显示全部楼层 |阅读模式
    本帖最后由 askjhas 于 2024-4-27 18:12 编辑

    Nfo Scraper
    Github 项目:https://github.com/spr-equinox/nfo_scraper
    一款免改名的半自动媒体刮削器
    由于动漫的命名比较特殊,一般的刮削器要通过大批量的改名才能识别,于是就有了写这个软件的想法
    这还是我首次发帖,有什么问题请多多包涵
    注意:本软件仍然处于非常前期的测试阶段,建议先使用硬链接副本进行测试
    特点
    • 没有严格的文件名/文件夹名的限制
    • 允许电影和剧集混合,统一生成剧集格式的元数据
    • 使用可自定义的正则表达式进行标题提取
    • 可自定义需要忽略的路径,并生成 .ignore 文件

    使用方法
    • 建议将媒体库按照如下格式排列(便于其他软件识别)大体上就是套两层文件夹(剧集-季度-视频文件),以下 .nfo 和 .ignore 由软件生成

      1. 媒体库
      2. ├─某个系列
      3. │  │  tvshow.nfo
      4. │  ├─[某个制作组] Mou Ge Fan Ju [Ma10p_1080p]
      5. │  │  │  season.nfo
      6. │  │  │  [某个制作组] Mou Ge Fan Ju [01][Ma10p_1080p][x265_flac_aac].mkv
      7. │  │  │  [某个制作组] Mou Ge Fan Ju [01][Ma10p_1080p][x265_flac_aac].nfo
      8. │  │  │  [某个制作组] Mou Ge Fan Ju [01][Ma10p_1080p][x265_flac_aac].sc.ass
      9. │  │  │  [某个制作组] Mou Ge Fan Ju [02][Ma10p_1080p][x265_flac].mkv
      10. │  │  │  [某个制作组] Mou Ge Fan Ju [02][Ma10p_1080p][x265_flac].nfo
      11. │  │  │  [某个制作组] Mou Ge Fan Ju [02][Ma10p_1080p][x265_flac].sc.ass
      12. │  │  ├─CDs
      13. │  │  │  │  .ignore
      14. │  │  │  └─[771332] 某个CD [24bit_48kHz] (flac)
      15. │  │  │          01. 某首歌.flac
      16. │  │  └─SPs
      17. │  │        .ignore
      18. │  │        [某个制作组] Mou Ge Fan Ju [CM01][Ma10p_1080p][x265_flac].mkv
      19. │  │        [某个制作组] Mou Ge Fan Ju [CM02][Ma10p_1080p][x265_flac].mkv
      20. │  ├─[某个制作组][Mou Ge Fan Ju Movie][Ma10p_2160p][v2]
      21. │  │  │  season.nfo
      22. │  │  │  [某个制作组][Mou Ge Fan Ju Movie][Ma10p_1080p][x265_flac].chs.ass
      23. │  │  │  [某个制作组][Mou Ge Fan Ju Movie][Ma10p_1080p][x265_flac].mkv
      24. │  │  └─某个无关文件夹
      25. │  │        .ignore
      26. │  │        某些无关文件.png
      27. │  └─Mou Ge Fan Ju S2
      28. │         season.nfo
      29. │         Mou Ge Fan Ju S2.mkv
      30. │         Mou Ge Fan Ju S2.nfo
      31. │         Mou Ge Fan Ju S2.sc.ass
      32. └─某部电影
      33.         A Movie-[1080p][BDRIP][x265.FLAC].chs_jpn.ass
      34.         A Movie-[1080p][BDRIP][x265.FLAC].mkv
      35.         A Movie-[1080p][BDRIP][x265.FLAC].nfo
      36.         season.nfo
      复制代码


    • 打开软件目录下的 config.json (没有的在仓库下),填好 tmdb_api_key,有需要的可以自定义其他内容
    • 打开软件,把媒体文件夹拖入窗口,注意不要有重复文件夹
    • 选择“下一步”,检测搜索到的文件夹是否正确。在这步可以为需要忽略的文件夹创建 .ignore 文件,全选( Ctrl + A)列表“被忽略的路径”,选择“创建 .ignore 文件”
    • 选择“下一步”,本窗口用于创建剧集元数据。全选,再选择“搜索所选项”。软件会按照“搜索名称”向服务器搜索,如果有错误,可以双击“搜索名称”进行更改,再选择“搜索所选项”再次搜索;也可以双击错误的条目,或者选中错误的条目,选择“手动搜索所选项”,手动指定搜索结果;除此之外,还可以手动输入 ID 和类别,再选择“更新所选项”,手动指定条目
    • 全选,选择写入所选项,这一步会创建 tvshow.nfo
    • 选择“下一步”,本窗口用于创建季度元数据,季度的 ID 将会从父文件夹处继承。继承的 ID 需要手动更新季度数据,即全选并选择“更新所选项”。手动为每一个剧集指定季度。如果 ID 有误,可以用和上一步一样的方法修正
    • 全选,选择写入所选项,这一步会创建 season.nfo
    • 选择“下一步”,本窗口用于创建单集元数据。软件会先自动获取每一季度的单集信息,尝试与本地的视频进行一一对应,如果数量一致,状态会被标记为“√”,否则就是“×”。此时需要我们手动调整,双击待处理的项目,将本地视频从列表中移除、添加或者把获取到的数据移除、添加,让两边的数量和顺序对应。本地视频数量与元数据数量不匹配的话将无法写入此季度
    • 全选,选择写入所选项,这一步会创建 <文件名>.nfo
    • 选择“下一步”,本窗口用于为季度文件夹中无关的子文件夹创建 .ignore 文件。全选列表,选择“创建 .ignore 文件”即可完成操作
    • 选择“完成”结束刮削



    导入jellyfin方法
    选择“混合电影和电视剧”,然后把所有刮削器包括图片刮削器都关掉
    导入媒体库并且扫描结束之后再选择“刷新媒体库”
    刷新模式选覆盖所有元数据、替换现有图片

    下载地址:
    https://github.com/spr-equinox/nfo_scraper/releases

    评分

    参与人数 2活跃度 +7200 收起 理由
    Yukarubih + 6400 很给力!
    nene908 + 800

    查看全部评分

    回复

    使用道具 举报

  • TA的每日心情
    慵懒
    2024-4-25 20:48
  • 签到天数: 28 天

    [LV.4]偶尔看看III

    11

    主题

    33

    回帖

    320

    VC币

    白金会员

    Rank: 12Rank: 12Rank: 12

    积分
    56845
    QQ
    Alicelotus 发表于 2024-4-24 22:33:49 | 显示全部楼层
    本帖最后由 Alicelotus 于 2024-4-24 22:51 编辑

    之前就是因为下的基本都是vcb又喜欢bt保种所以都懒得改名。这次看见稍微试着玩了一下。
    说说自己踩得坑
    ①遇到的第一个坑。config.json这里试了几次api密钥都不行,最后发现原来是用TMDB下面那个“API 读访问令牌”才对
    "tmdb_api_key": ""
    // tmdb api 密钥,必填,否则无法使用

    遇到的第二个问题。我的存储方式是这样的。因为Anime文件夹下已经存了不知道多少部动画了,所以直接拖拽Anime主文件夹进去几百行直接头都晕了。所以不太可能直接拖Anime文件夹。
    Anime(主文件夹)
    ——[UHA-WINGS&VCB-Studio] EIGHTY SIX [Ma10p_1080p](二级文件夹)       ——SPs(三级文件夹)

           ——[UHA-WINGS&VCB-Studio] EIGHTY SIX [01][Ma10p_1080p][x265_flac_aac].mkv
    ——[VCB]零之使魔全四季(二级文件夹)
           ——[VCB]零之使魔第一季(三级文件夹)
                   ——SPs(四级文件夹)
                   ——[VCB-Studio] Zero no Tsukaima [01][Ma10p_1080p][x265_flac].mkv
           ——[VCB]零之使魔第二季(三级文件夹)

    选择直接拖[VCB]86 不存在的战区(二级文件夹)这种就只有一季度的动画时,就会变成无法读取下面的mkv文件。只能读取SPs这些三级文件夹以及里面的内容

    但拖拽如[VCB]零之使魔全四季(二级文件夹)这些不只有一季而是多季度的时候就会好起来

    遇到的第三个坑没有认真看github的使用方法。点进去以后搜索完TMDB对应信息,原来不是直接点击下一步,而是需要先点左边的写入 之后才点下一步。我一开始还以为下一步是就直接帮你写入好文件然后进行下一步。。。
    同时注意到VCB零之使魔的这四季,第一季和第四季的这个命名是可以直接搜索到对应TMDB信息的,但第二季和第三季是不可以直接搜的,需要手动重新打剧集名称来搜索写入。
    而这一步能否自动搜索则关系到下面的第四个问题

    遇到的第四个坑。已经写入好tvshow.nfo  season.nfo  <文件名>.nfo  .ignore 这四样东西后。去EMBY创建媒体库。
    思考着,既然nfo文件里都已经把视频简介,剧集信息,预览图url都写进去了。那么只需要读取NFO文件,其他什么都不要不就行了?
    创建EMBY媒体库
    类型一:啥都没选
    内容类型:电视节目
    ✅元数据读取器NFO
    ❌电视节目 元数据下载器
    ❌季 元数据下载器
    ❌集 元数据下载器
    ❌]电视节目 的图像获取器
    ❌季 的图像获取器
    ❌]集 的图像获取器

    全部刮削失败
    SPs与正片内容 分为两个文件夹
    每集的预览图 ×
    每集的简介 √
    由于上面类型一的设置失败,那么就试着全部都只选TMDB这一个源来刮削
    创建EMBY媒体库
    类型二:全选TMDB刮削
    内容类型:电视节目
    名称:电视节目
    ✅元数据读取器NFO
    ✅电视节目 元数据下载器 TheMoiveDb
    ❌季 元数据下载器
    ✅集 元数据下载器 TheMoiveDb
    ✅电视节目 的图像获取器 TheMoiveDb
    ✅季 的图像获取器 TheMoiveDb
    ✅集 的图像获取器 TheMoiveDb
    遇到和③类似的问题,86 零使第一季和第四季刮削成功,零使1和4季度自动合并。但第二和第三季无法正常识别。
    刮削成功的86和零使1 4,点进内部
    SPs与正片内容 分为两个文件夹
    每集的预览图 √
    每集的简介 √
    创建EMBY媒体库类型三:创建混合内容
    内容类型:混合内容
    名称:混合内容
    ✅元数据读取器NFO
    ✅电视节目 元数据下载器 TheMoiveDb
    ❌季 元数据下载器 TheMoiveDb
    ✅集 元数据下载器 TheMoiveDb
    ✅电影 元数据下载器 TheMoiveDb
    ✅电视节目 的图像获取器 TheMoiveDb
    ✅季 的图像获取器 TheMoiveDb
    ✅集 的图像获取器 TheMoiveDb
    ✅电影 的图像获取器 TheMoiveDb
    86和零使 4季 全部刮削成功
    但是点进内部
    仅有一季的86 SPs与正片内容分为两个文件夹
    有多季度的零使SPs与正片内容 合并为了一个文件夹
    每集的预览图 √
    每集的简介 √

    这一次基本算是成功了,但只算成功了90%,因为SP和正片内容混在一起了。

    类型四:终于解决了
    内容类型:电视节目
    创建EMBY媒体库
    ✅元数据读取器NFO
    ✅电视节目 元数据下载器 TheMoiveDb-TheTVDB(比类型二多选了一个TheTVDB)
    ❌季 元数据下载器 TheMoiveDb
    ✅集 元数据下载器 TheMoiveDb
    ✅电视节目 的图像获取器 TheMoiveDb
    ✅季 的图像获取器 TheMoiveDb
    ✅集 的图像获取器 TheMoiveDb

    全部刮削成功
    SPs与正片内容 分为两个文件夹
    每集的预览图 √
    每集的简介 √



    然后得出结论,其实就是直接选创建电视节目的媒体库,选好偏好语言之后直接按默认的保存就完事了,或者在默认的基础上再勾上TMDB的源获取。
    但还有最后一种就是类似魔禁系列这种。多季度+剧场版的没试过在电视节目媒体库下的表现会是怎么样的。


    综上所述就是这几个坑,其实①③④都解决了。唯独②,关于单季度番剧的剧集信息nfo写入的这个问题。我除了特意创建多一个文件夹把86拖进去让它多添加一层之后,写好了nfo再把他们又重新拖回出来没别的办法。
    所以楼主可以改一改软件让类似单季度这样的番剧没必要额外再在上面多添加一层文件夹后才能读取吗?


    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    2024-2-1 09:11
  • 签到天数: 2 天

    [LV.1]初来乍到

    1

    主题

    3

    回帖

    0

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    8018
    askjhas  楼主| 发表于 2024-4-24 23:11:26 | 显示全部楼层
    本帖最后由 askjhas 于 2024-4-24 23:19 编辑
    Alicelotus 发表于 2024-4-24 22:33
    之前就是因为下的基本都是vcb又喜欢bt保种所以都懒得改名。这次看见稍微试着玩了一下。
    说说自己踩得坑{:10 ...

    我估计你的情况是直接把视频文件夹直接拖入软件了,我的搜索逻辑是不识别直接裸露在媒体库文件夹下的视频文件,因为这个文件夹可能没有父路径,会让程序崩溃。我也许可以搞个选项让单季的文件夹识别,跳过刮取剧集的操作
    我的设想是直接放大的anime文件夹进去的,我自己刮削整个大的文件夹(5TB)大概用了15min

    由于我没有去试 EMBY不知道具体情况。只试了 jellyfin,jellyfin我是选择“混合电影和电视剧”,然后把所有刮削器包括图片刮削器都关掉,就能正常读取。软件写入的nfo文件中的图片用的是超链接的方式,所以要通过某些方法连上 image.tmdb.org,一开始是没有图片的,但可以看到有网络连接。jellyfin显示读取完媒体库之后,网络也不活动了,仍然没有图片,但是把jellyfin开着放一段时间,估计软件刷新了,图片就出来了,不知道EMBY是不是类似的问题。

    SP的话实在太乱了,有菜单啊,访谈之类的,tmdb还不一定有收录,是没有打算让软件刮的。但sp没有元数据就会搞乱页面,所以我在最后一步给了写入.ignore文件的选项(记得全选,再点写入),用来让jellyfin和EMBY不读取sp或者cd这些非正片的文件夹


    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2024-4-25 20:48
  • 签到天数: 28 天

    [LV.4]偶尔看看III

    11

    主题

    33

    回帖

    320

    VC币

    白金会员

    Rank: 12Rank: 12Rank: 12

    积分
    56845
    QQ
    Alicelotus 发表于 2024-4-25 19:23:53 | 显示全部楼层
    askjhas 发表于 2024-4-24 23:11
    我估计你的情况是直接把视频文件夹直接拖入软件了,我的搜索逻辑是不识别直接裸露在媒体库文件夹下的视频 ...

    昨晚看见你说的就去试了试Jellyfin。
    在emby和jellyfin两边都是创建的混合内容。都是只读取元nfo文件,其他下载器获取器全关的情况下。


    首先是单季度的,由于没有上一集文件夹,第一步的tvshow.nfo写入跳过,只写入的season和单集nfo的情况。

    emby和jellyfin都是可以不可以直接识别出剧集信息的。emby是直接啥都没有,jellyfin是点进去只有单集的标题和简介,但顺序都是乱的。


    接着是把tvshow.nfo放回去单季度的文件里,和season他们在同一个文件夹下,就都可以成功显示剧集了。
    然后就是和多季度剧集一样,跟我楼上提到过的问题④的类型一那样了。只有单集的标题和简介,然后剧集和单集的图像都是没有的。

    然后发现emby和jellyfin两边都是只有演员的图片


    然后想着楼主说过开着放一段时间就有,但昨晚到现在依旧还是保持原样,楼主能截一下看看你的媒体库设置是怎么样的吗。
    我现在jellyfin什么都不选是这样的。SPs不选igonre是想着里面有NCOP之类的,但这估计是没啥方法解决了。实在不行还是只能改名或者忽略了
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    2024-2-1 09:11
  • 签到天数: 2 天

    [LV.1]初来乍到

    1

    主题

    3

    回帖

    0

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    8018
    askjhas  楼主| 发表于 2024-4-25 20:06:45 | 显示全部楼层
    本帖最后由 askjhas 于 2024-4-27 18:11 编辑
    Alicelotus 发表于 2024-4-25 19:23
    昨晚看见你说的就去试了试Jellyfin。
    在emby和jellyfin两边都是创建的混合内容。都是只读取元nfo文件,其 ...

    我的设置和你一摸一样,是有这样的效果的,找了个有剧场版和多季的

    可以去这里看看Jellyfin的日志,有没有网络连接错误
    C:\ProgramData\Jellyfin\Server\log
    像这样的
    1. [2024-04-25 20:15:52.203 +08:00] [ERR] [90] MediaBrowser.Providers.Manager.ProviderManager: "TmdbEpisodeImageProvider" failed in GetImageInfos for type "Episode" at ""
    2. System.Net.Http.HttpRequestException: 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。 (api.themoviedb.org:443)
    3. ---> System.Net.Sockets.SocketException (10060): 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。
    4.    at System.Net.Sockets.Socket.AwaitableSocketAsyncEventArgs.ThrowException(SocketError error, CancellationToken cancellationToken)
    5.    at System.Net.Sockets.Socket.AwaitableSocketAsyncEventArgs.System.Threading.Tasks.Sources.IValueTaskSource.GetResult(Int16 token)
    6.    at System.Net.Sockets.Socket.<ConnectAsync>g__WaitForConnectWithCancellation|277_0(AwaitableSocketAsyncEventArgs saea, ValueTask connectTask, CancellationToken cancellationToken)
    7.    at System.Net.Http.HttpConnectionPool.ConnectToTcpHostAsync(String host, Int32 port, HttpRequestMessage initialRequest, Boolean async, CancellationToken cancellationToken)
    8.    --- End of inner exception stack trace ---
    9.    at System.Net.Http.HttpConnectionPool.ConnectToTcpHostAsync(String host, Int32 port, HttpRequestMessage initialRequest, Boolean async, CancellationToken cancellationToken)
    10.    at System.Net.Http.HttpConnectionPool.ConnectAsync(HttpRequestMessage request, Boolean async, CancellationToken cancellationToken)
    11.    at System.Net.Http.HttpConnectionPool.CreateHttp11ConnectionAsync(HttpRequestMessage request, Boolean async, CancellationToken cancellationToken)
    12.    at System.Net.Http.HttpConnectionPool.AddHttp11ConnectionAsync(HttpRequestMessage request)
    13.    at System.Threading.Tasks.TaskCompletionSourceWithCancellation`1.WaitWithCancellationAsync(CancellationToken cancellationToken)
    14.    at System.Net.Http.HttpConnectionPool.GetHttp11ConnectionAsync(HttpRequestMessage request, Boolean async, CancellationToken cancellationToken)
    15.    at System.Net.Http.HttpConnectionPool.SendWithVersionDetectionAndRetryAsync(HttpRequestMessage request, Boolean async, Boolean doRequestAuth, CancellationToken cancellationToken)
    16.    at System.Net.Http.DiagnosticsHandler.SendAsyncCore(HttpRequestMessage request, Boolean async, CancellationToken cancellationToken)
    17.    at System.Net.Http.RedirectHandler.SendAsync(HttpRequestMessage request, Boolean async, CancellationToken cancellationToken)
    18.    at System.Net.Http.HttpClient.<SendAsync>g__Core|83_0(HttpRequestMessage request, HttpCompletionOption completionOption, CancellationTokenSource cts, Boolean disposeCts, CancellationTokenSource pendingRequestsCts, CancellationToken originalCancellationToken)
    19.    at TMDbLib.Rest.RestRequest.SendInternal(HttpMethod method, CancellationToken cancellationToken)
    20.    at TMDbLib.Rest.RestRequest.Get[T](CancellationToken cancellationToken)
    21.    at TMDbLib.Rest.RestRequestExtensions.GetOfT[T](RestRequest request, CancellationToken cancellationToken)
    22.    at TMDbLib.Client.TMDbClient.GetConfigAsync()
    23.    at MediaBrowser.Providers.Plugins.Tmdb.TmdbClientManager.EnsureClientConfigAsync()
    24.    at MediaBrowser.Providers.Plugins.Tmdb.TmdbClientManager.GetEpisodeAsync(Int32 tvShowId, Int32 seasonNumber, Int32 episodeNumber, String displayOrder, String language, String imageLanguages, CancellationToken cancellationToken)
    25.    at MediaBrowser.Providers.Plugins.Tmdb.TV.TmdbEpisodeImageProvider.GetImages(BaseItem item, CancellationToken cancellationToken)
    26.    at MediaBrowser.Providers.Manager.ProviderManager.GetImages(BaseItem item, IRemoteImageProvider provider, String preferredLanguage, Boolean includeAllLanguages, CancellationToken cancellationToken, Nullable`1 type)
    27. [2024-04-25 20:15:55.419 +08:00] [ERR] [90] Emby.Server.Implementations.Library.LibraryManager: Cannot compute blurhash for "C:\ProgramData\Jellyfin\Server\metadata\library\6a\6ab0abd3f58697a7659fa0d749550bc1\poster.jpg"
    复制代码

    image.tmdb.org 的连接性貌似不稳定
    还是没有的话刷新一下元数据,选覆盖所有,在代理日志里面看看有没有image.tmdb.org的网络连接
    目录结构放附件了

    --2024.4.27--

    已经基本确定了怎么导入jellyfin
    导入媒体库之后选择“刷新媒体库”

    刷新模式选覆盖所有元数据、替换现有图片




    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?立即注册

    x
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表