找回密码
 立即注册
楼主: hx168

硬字幕提取工具10.0 - 超好用(”语音提词2.0”发布了!欢迎试用)

  • TA的每日心情
    开心
    2021-6-1 15:58
  • 签到天数: 13 天

    [LV.3]偶尔看看II

    1

    主题

    207

    回帖

    0

    VC币

    高级会员

    Rank: 4

    积分
    28830
    hx168  楼主| 发表于 2022-3-28 18:40:45 | 显示全部楼层
    本帖最后由 hx168 于 2022-3-28 20:44 编辑
    乂MAN哥乂 发表于 2022-3-28 14:54
    樓主終於回來論壇了,我沒有知乎帳號,所以不能在那邊留言,整理出我遇到的一些問題:
    如果在文字輸入區的 ...

    謝謝您的反饋!

    1、如果在文字輸入區的文字頭新增文字,整行文字會居左。
    這個是工具採用的圖形庫的bug,目前暫時沒法解決,只能盡量避免先編輯句子第一個字符。

    2、如果校對窗裡只有單頁校對,在調整字號時會彈出「Failed to obtain/convert traceback!」後閃退。
    這個問題我再查一下

    3、在校對窗「Ctrl+右鍵」,雖然能合併選擇,但是會彈出OCR提示,阻礙選擇,而且無法用雙擊右鍵來固定自己想要保存的畫面,例如下面那行OCR得比較好,我想保存下面那行,但無法做到,同理,「Ctrl+左鍵」時仍會複製字幕至剪貼版。
    右鍵菜單跟「Ctrl+右鍵」衝突,確實不方便,不美觀,圖形庫暫時沒找到辦法區分兩種動作,後續想辦法。
    複製到剪貼板的問題,下個版本校對窗中會去掉此功能。

    4、在校對窗裡,若需合併的兩行字幕被分開兩頁,這時就不能進行刪合,建議把刪合換成總刪合,或直接新增一個總刪合。
    跨頁合併的問題,謝謝您的建議,下個版本會改成‘總刪合’。

    5、刪合窗裡,明明合併提示是1ms,但有些1ms的字幕沒有提示。
    上下兩條字幕間隔低於1ms,卻沒有提示,這個我查一下。

    6、刪合窗時,第一個和第二個是相同字幕,第三個和第四個是相同字幕,這時就需要分開兩次來合併,不然第三與第四的字幕也會合併到第一個字幕裡。
    這個功能可看用戶手冊,「Ctrl+右鍵」可設置gap,分開兩個不同的合併,同時還支持雙擊右鍵,自定義需要保留的字幕圖片。

    7、在刪合和校對窗裡,如果字幕被左鍵或右鍵選中,希望在右邊的文件夾欄裡加上相應的顏色,因為想看看字幕的時間碼是不是相近。
    這個功能沒必要,首先圖片5頁的跨度會超過左邊listbox的一頁跨度,其實只要合併提示做到準確可靠,就不需要看時間碼。

    8、另外也希望可以新增支援SUP、IDX+SUB等等的這些圖像文字。
    sup研究一下,看能不能做。

    9、TR算是離線OCR裡最好的那個了,可惜只支援簡中,而不支援繁中,其他離線OCR多多少少也有些問題…後續會加入更多ocr引擎



    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    郁闷
    2023-6-27 12:17
  • 签到天数: 29 天

    [LV.4]偶尔看看III

    1

    主题

    26

    回帖

    1527

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    7275

    崭露头角新人登场

    乂MAN哥乂 发表于 2022-3-30 01:27:22 | 显示全部楼层
    本帖最后由 乂MAN哥乂 于 2022-3-30 02:03 编辑
    hx168 发表于 2022-3-28 18:40
    謝謝您的反饋!

    1、如果在文字輸入區的文字頭新增文字,整行文字會居左。
    在校對窗裡,若需合併的兩行字幕被分開兩頁,這時就不能進行刪合,建議把刪合換成總刪合,或直接新增一個總刪合。
    跨頁合併的問題,謝謝您的建議,下個版本會改成‘總刪合’。
    建議在校對窗裡把刪除和合併分開,刪除鍵用普通刪除,合併鍵用總合併,因為OCR後會標註空字幕的,但也有可能是有字幕但漏OCR,這時候如果是總刪就會不小心刪掉字幕。

    刪合窗裡,明明合併提示是1ms,但有些1ms的字幕沒有提示。
    上下兩條字幕間隔低於1ms,卻沒有提示,這個我查一下。

    在刪合和校對窗裡,如果字幕被左鍵或右鍵選中,希望在右邊的文件夾欄裡加上相應的顏色,因為想看看字幕的時間碼是不是相近。
    這個功能沒必要,首先圖片5頁的跨度會超過左邊listbox的一頁跨度,其實只要合併提示做到準確可靠,就不需要看時間碼。
    其實是因為我在校對時看到部份字幕翻譯有點問題,所以想在播放器看看,但找時間碼時就需要花點時間…
    而且我不太想在刪合窗做刪合,而是想先OCR,然後再在校對窗做校對,那遇到上下皆相同字幕時就可以先右鍵它們,然後在左側看時間碼是否相近來作判斷。

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?立即注册

    x
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-6-1 15:58
  • 签到天数: 13 天

    [LV.3]偶尔看看II

    1

    主题

    207

    回帖

    0

    VC币

    高级会员

    Rank: 4

    积分
    28830
    hx168  楼主| 发表于 2022-4-3 00:36:58 | 显示全部楼层
    乂MAN哥乂 发表于 2022-3-30 01:27
    建議在校對窗裡把刪除和合併分開,刪除鍵用普通刪除,合併鍵用總合併,因為OCR後會標註空字幕的,但也有可 ...

    校对窗下个版本更新会保留‘删合’键,只是会处理:前一页+本页+后一页,总共3页的删除合并,支持跨3页同时避免误删。

    1ms合并提示确实有问题,查了代码是小数比较未能如愿,python代码有点玄乎,你的图片例如中,间隔 = 小数-小数 = 0.001秒,然后间隔 <= 0.001秒这种以为必true的判断竟然返回false,改用整数ms比较就没问题了。

    你提到的增加间距ms显示,会在下个版本更新提供。

    点评

    浮點數在各種語言裡,都不夠精準 (像 1.005 四捨五入到第二位,會變成 1.00),要準確一點的話,還是要用 decimal 之類的  发表于 2022-4-3 22:58
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-6-1 15:58
  • 签到天数: 13 天

    [LV.3]偶尔看看II

    1

    主题

    207

    回帖

    0

    VC币

    高级会员

    Rank: 4

    积分
    28830
    hx168  楼主| 发表于 2022-4-5 16:43:55 | 显示全部楼层
    乂MAN哥乂 发表于 2022-3-30 01:27
    建議在校對窗裡把刪除和合併分開,刪除鍵用普通刪除,合併鍵用總合併,因為OCR後會標註空字幕的,但也有可 ...

    9.0版更新了,提供了‘前距’ms显示功能,合并标记改为alt+鼠标左键。一些提到的bug也清理了一遍,您可以试试看。

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    郁闷
    2023-6-27 12:17
  • 签到天数: 29 天

    [LV.4]偶尔看看III

    1

    主题

    26

    回帖

    1527

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    7275

    崭露头角新人登场

    乂MAN哥乂 发表于 2022-4-5 18:08:17 | 显示全部楼层
    本帖最后由 乂MAN哥乂 于 2022-4-5 18:12 编辑
    hx168 发表于 2022-4-5 16:43
    9.0版更新了,提供了‘前距’ms显示功能,合并标记改为alt+鼠标左键。一些提到的bug也清理了一遍,您可以 ...

    辛苦您了

    在校對窗時,修改完文字後按檢測框、左對齊或修改字體大小,整頁文字都會回復原樣;而且在修改完最後一頁後按返回主界面或直接生成SRT,最後一頁的修改處也不會儲存,須手動切換上下頁。

    校對窗刪合建議改為上頁+本頁,畢竟加入下頁的話,沒辦法保證下一頁有沒有漏OCR的圖片,需要手動回到上一頁或看完下一頁沒有漏OCR後再回到本頁按刪合。

    校對窗拖動圖片後返回主界面,再回到校對窗時,圖片會回復原位。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-6-1 15:58
  • 签到天数: 13 天

    [LV.3]偶尔看看II

    1

    主题

    207

    回帖

    0

    VC币

    高级会员

    Rank: 4

    积分
    28830
    hx168  楼主| 发表于 2022-4-5 19:46:47 | 显示全部楼层
    乂MAN哥乂 发表于 2022-4-5 18:08
    辛苦您了

    在校對窗時,修改完文字後按檢測框、左對齊或修改字體大小,整頁文字都會回復原樣;而且在修改 ...

    謝謝您的建議!會在下一次更新修改。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    15 小时前
  • 签到天数: 2026 天

    [LV.Master]伴坛终老

    1

    主题

    3

    回帖

    0

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    375708
    key001 发表于 2022-4-5 21:00:55 | 显示全部楼层
    本帖最后由 key001 于 2022-4-5 21:06 编辑

    有没有单独分离 esrXP功能的版本?
    esrXP才2M大

    只要输出的识别文字的图片.

    esrXP的过滤器太旧了 ,跟不上时代了,........

    只要文字图片干净,各种免费的第三方识别软件都问题不大.....
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-6-1 15:58
  • 签到天数: 13 天

    [LV.3]偶尔看看II

    1

    主题

    207

    回帖

    0

    VC币

    高级会员

    Rank: 4

    积分
    28830
    hx168  楼主| 发表于 2022-4-5 21:06:30 | 显示全部楼层
    salty 发表于 2022-2-10 10:41
    辛苦大佬了,有没有可能增加或者可以自定义重新连接的次数?或者增加五次连接失败后的数秒钟再次自动尝试连 ...

    可以试试9.0版,看看有没改善。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-6-1 15:58
  • 签到天数: 13 天

    [LV.3]偶尔看看II

    1

    主题

    207

    回帖

    0

    VC币

    高级会员

    Rank: 4

    积分
    28830
    hx168  楼主| 发表于 2022-4-5 21:16:23 | 显示全部楼层
    本帖最后由 hx168 于 2022-4-5 22:07 编辑
    乂MAN哥乂 发表于 2022-3-28 14:54
    樓主終於回來論壇了,我沒有知乎帳號,所以不能在那邊留言,整理出我遇到的一些問題:
    如果在文字輸入區的 ...

    请问关于sup、idx+sub,转srt,这种需求多吗?
    如果要做,技术线路是这样吗?:
    1、手头有了sup、idx+sub

    2、BDSup2Sub导出XML与PNG

    3、用硬字幕提取工具识别生成SRT

    subtitleEdit里面也有sup导入然后ocr生成SRT的功能,您是觉得它的ocr不满意还是其他原因?
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    郁闷
    2023-6-27 12:17
  • 签到天数: 29 天

    [LV.4]偶尔看看III

    1

    主题

    26

    回帖

    1527

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    7275

    崭露头角新人登场

    乂MAN哥乂 发表于 2022-4-5 23:23:27 | 显示全部楼层
    本帖最后由 乂MAN哥乂 于 2022-4-5 23:54 编辑
    hx168 发表于 2022-4-5 21:16
    请问关于sup、idx+sub,转srt,这种需求多吗?
    如果要做,技术线路是这样吗?:
    1、手头有了sup、idx+sub  ...

    sup、idx+sub好像不用弄了,我找到了最簡單的方法:
    把sup或idx+sub丟進SubtitleEdit,在OCR文字區按右鍵>匯出,選擇最後一項的「圖像名稱以時間碼儲存」,選擇輸出文件夾為「VideoSubFinder\RGBImages」,硬字幕提取工具就能以正常時間碼生成SRT。

    SubtitleEdit的OCR功能還是挺難用的。

    另外軟件提議
    生成SRT時為什麼會彈出TXT檔,TXT檔是有什麼必要性嗎?這個TXT檔能不能不要一同開啟?
    在軟件點擊開啟SubtitleEdit時,能不能把生成的SRT檔自動導入SubtitleEdit,不行的話可以轉為開啟時一同開啟SRT檔的所在位置嗎?
    這張圖片使用離線TR OCR不知道為什麼會提示這個,之前和之後都沒事,沒連接任何VPN
    然後按OCR就一直提示這個,需要轉換其他OCR進行OCR後再轉回TR,或自行輸入文字再用TR OCR才行

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?立即注册

    x
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表