Beatrice-Raws 发表于 2019-11-20 16:11:04

大神的github还有吗

NoobNeo 发表于 2019-11-20 21:21:39

本帖最后由 NoobNeo 于 2019-11-20 21:34 编辑

沉睡森林 发表于 2019-11-18 20:43
大佬,我想問的是怎麼避免識別出來的字幕句數目太多,太多的話在刪減字幕的時候會卡死,每次都刪減到一大半 ...
如果相同的字幕图像重复出现, 需要把 SSIM 或 PSNR 数值调低点, SSIM 不建议低于 0.9, 容易误合并; 如果是不同的图像重复出现, 部分极端情况可能1~5帧一个图像, 你需要调整滤镜.
删减时卡死多数是显存太小造成的, 典型表现是任务管理器中 GPU 的占用爆了.

及时的进行 "删除&合并" 操作可以避免这个问题.

另外显存低于2G的 "配置-每页数量" 这个数值不要大于300.

开始删减前建议执行一次 "保存" 操作, 遇到卡死但窗口标题界面没有 "无响应"的时候, 用快捷键 "CTRL + S" 可以后台保存.


NoobNeo 发表于 2019-11-20 21:23:08

hitomae 发表于 2019-11-19 20:11
0.0.1-3 - alpha

打开报错


你没有划定字幕区域就执行滤镜操作或字幕提取操作了, 务必先划定字幕区域再去执行后面的操作.

NoobNeo 发表于 2019-11-20 21:26:14

Beatrice-Raws 发表于 2019-11-20 16:11
大神的github还有吗

alpha阶段不考虑放GitHub

hitomae 发表于 2019-11-21 22:27:42

NoobNeo 发表于 2019-11-20 21:23
你没有划定字幕区域就执行滤镜操作或字幕提取操作了, 务必先划定字幕区域再去执行后面的操作.
...




这样操作也报错,希望告知问题所在

NoobNeo 发表于 2019-11-21 23:29:41

hitomae 发表于 2019-11-21 22:27
这样操作也报错,希望告知问题所在

错误信息要贴出来,还有视频基本属性,使用的模块

hitomae 发表于 2019-11-22 00:07:20

NoobNeo 发表于 2019-11-21 23:29
错误信息要贴出来,还有视频基本属性,使用的模块

视频信息

General
Complete name                  : D:\临时\PERSONA5 the Animation\PERSONA5 the Animation.mp4
Format                         : MPEG-4
Format profile               : Base Media
Codec ID                     : isom (isom/avc1)
File size                      : 118 MiB
Duration                     : 17 min 29 s
Overall bit rate mode          : Variable
Overall bit rate               : 946 kb/s
Encoded date                   : UTC 2019-10-05 20:40:21
Tagged date                  : UTC 2019-10-05 20:40:21

Video
ID                           : 1
Format                         : AVC
Format/Info                  : Advanced Video Codec
Format profile               : [email protected]
Format settings                : CABAC / 4 Ref Frames
Format settings, CABAC         : Yes
Format settings, Reference fra : 4 frames
Codec ID                     : avc1
Codec ID/Info                  : Advanced Video Coding
Duration                     : 17 min 29 s
Bit rate                     : 751 kb/s
Maximum bit rate               : 8 513 kb/s
Width                        : 1 280 pixels
Height                         : 720 pixels
Display aspect ratio         : 16:9
Frame rate mode                : Constant
Frame rate                     : 23.976 (24000/1001) FPS
Color space                  : YUV
Chroma subsampling             : 4:2:0
Bit depth                      : 8 bits
Scan type                      : Progressive
Bits/(Pixel*Frame)             : 0.034
Stream size                  : 93.9 MiB (79%)
Writing library                : x264 core 157 r2935 545de2f
Encoding settings            : cabac=1 / ref=4 / deblock=1:0:0 / analyse=0x3:0x113 / me=hex / subme=7 / psy=1 / psy_rd=0.40:0.00 / mixed_ref=0 / me_range=16 / chroma_me=1 / trellis=1 / 8x8dct=1 / cqm=0 / deadzone=21,11 / fast_pskip=1 / chroma_qp_offset=-2 / threads=12 / lookahead_threads=3 / sliced_threads=0 / nr=0 / decimate=1 / interlaced=0 / bluray_compat=0 / constrained_intra=0 / bframes=5 / b_pyramid=0 / b_adapt=2 / b_bias=3 / direct=1 / weightb=1 / open_gop=0 / weightp=1 / keyint=240 / keyint_min=23 / scenecut=60 / intra_refresh=0 / rc_lookahead=20 / rc=crf / mbtree=1 / crf=22.0 / qcomp=0.60 / qpmin=10 / qpmax=51 / qpstep=4 / vbv_maxrate=62500 / vbv_bufsize=78125 / crf_max=0.0 / nal_hrd=none / filler=0 / ip_ratio=1.40 / aq=1:0.60
Encoded date                   : UTC 2019-10-05 20:40:21
Tagged date                  : UTC 2019-10-05 20:40:23
Codec configuration box      : avcC

Audio
ID                           : 2
Format                         : AAC LC
Format/Info                  : Advanced Audio Codec Low Complexity
Codec ID                     : mp4a-40-2
Duration                     : 17 min 29 s
Bit rate mode                  : Variable
Bit rate                     : 192 kb/s
Maximum bit rate               : 200 kb/s
Channel(s)                     : 2 channels
Channel layout               : L R
Sampling rate                  : 48.0 kHz
Frame rate                     : 46.875 FPS (1024 SPF)
Compression mode               : Lossy
Stream size                  : 24.0 MiB (20%)
Encoded date                   : UTC 2019-10-05 20:25:37
Tagged date                  : UTC 2019-10-05 20:40:23





设置如下

然后点击 参数设置直接报错



然后弹出下列图片的内容



不知道,说的是否详细了?

hitomae 发表于 2019-11-22 00:08:06

win10系统

Beatrice-Raws 发表于 2019-11-25 20:31:24

建议斑竹顶置

瞬间抛锚 发表于 2019-12-20 16:31:13

楼主你好,我发现即使帧间隔调成1帧,截取的时间轴还是不如esrXP的精确,不知道该怎么解决?

如图:
上面的是ocor(滤镜的全局设置用的默认数值),下面的是我以前用esrXP做的。实际观看效果就是用ocor截取的时间轴会跟原视频的字幕有肉眼可见的微小误差,而esrXP截取的时间轴可以做到高度重合
页: 1 2 3 [4] 5 6 7 8 9 10 11 12 13
查看完整版本: 为了更便捷的手抄字幕, 我搞了一个新玩具(更新 0.0.6-beta)