硬字幕提取工具10.0 - 超好用（”语音提词2.0”发布了！欢迎试用）

hx168 · 发表于 2022-4-5 23:54:01

本帖最后由 hx168 于 2022-4-6 00:46 编辑

乂MAN哥乂发表于 2022-4-5 23:23
sup、idx+sub好像不用弄了，我找到了最簡單的方法：
把sup或idx+sub丟進SubtitleEdit，在OCR文字區按右鍵> ...

Tesseract是挺烂的。。。
你这个方法很好，SubtitleEdit的时间码跟VSF相互兼容，挺方便的。

生成SRT時為什麼會彈出TXT檔，TXT檔是有什麼必要性嗎？這個TXT檔能不能不要一同開啟？
A:这个是因为有些用户想要txt档，所以一起生成了，关闭就好

在軟件點擊開啟SubtitleEdit時，能不能把生成的SRT檔自動導入SubtitleEdit，不行的話可以轉為開啟時一同開啟SRT檔的所在位置嗎？

A:目前工具就是点APP2的时候调用SubtitleEdit自动打开123.srt的（APP2设置为SubtitleEdit）

這張圖片使用離線TR OCR不知道為什麼會提示這個，之前和之後都沒事，沒連接任何VPN

A:这张出问题的图片可以发给我查一下原因[email protected]。更新：这张图片tr似乎不能正常识别，即使放大到一定程度则不会exception，但是识别为空。可能是图片尺寸太小，也可能是tr底层代码的bug，看不到没办法查。
以后再次遇到类似情况，可以勾选‘增强’，将会放大图片给ocr引擎做识别，也可右键用其他ocr引擎识别完，去勾选‘重做’，从断点继续识别。

乂MAN哥乂 · 发表于 2022-4-6 00:46:38

本帖最后由乂MAN哥乂于 2022-4-6 00:57 编辑

hx168 发表于 2022-4-5 23:54
Tesseract是挺烂的。。。
你这个方法很好，SubtitleEdit的时间码跟VSF相互兼容，挺方便的。

雖然這方法挺方便，但不知道能不能再簡化一點？
例如開啟SUP或SUB+IDX後，可以自動選擇「圖像名稱以時間碼儲存」，然後把這些圖像自動儲存到用戶在硬字幕提取工具所選擇的圖片文件夾（大部份用戶應該是選擇RGBImages文件夾？）
（如果可以做到的話，有時一個SUB+IDX檔可能會包含幾種不同的字幕，例如繁簡英）

那能不能把開啟TXT變為可選功能？

百度OCR時有時會「間隔標記丟失，嘗試糾正！」，然後會自動繼續OCR，在第一輪OCR結束後會對剛才OCR失敗的圖片再進行OCR，但第二輪的OCR好像不支持疊圖，我看到第二輪的每次OCR都只有一句。請問第二輪的OCR也可以支持疊圖／半疊嗎，不然有點浪費額度？（不知道9.0有沒有支援）

我看了知乎的留言，好像有點道理，雖然我不知道他為什麼會提取到一兩千張廢圖，但我記得esrXP的刪合窗有一個功能是「僅顯示已標記字幕」，不知道會否將此功能加進來？這樣就不用在過千張圖片裡找那些已標記的空字幕。

hx168 · 发表于 2022-4-6 00:56:43

本帖最后由 hx168 于 2022-4-6 00:59 编辑

乂MAN哥乂发表于 2022-4-6 00:46
雖然這方法挺方便，但不知道能不能再簡化一點？
例如開啟SUP或SUB+IDX後，可以自動選擇「圖像名稱以時間碼 ...

雖然這方法挺方便，但不知道能不能再簡化一點？
例如開啟SUP或SUB+IDX後，可以自動選擇「圖像名稱以時間碼儲存」，然後把這些圖像自動儲存到用戶在硬字幕提取工具所選擇的圖片文件夾（大部份用戶應該是選擇RGBImages文件夾？）
（如果可以做到的話，有時一個SUB+IDX檔可能會包含幾種不同的字幕，例如繁簡英）

A: 这个要研究一下，工作量太大就不好做，我用python确实可以做类似pyautogui的工作（查找替换就是一个例子）
导出不同字幕轨，导出到不同目录，用户应该都有需求，比较难统一

百度OCR時有時會「間隔標記丟失，嘗試糾正！」，然後會自動繼續OCR，在第一輪OCR結束後會對剛才OCR失敗的圖片再進行OCR，但第二輪的OCR好像不支持疊圖，我看到第二輪的每次OCR都只有一句。請問第二輪的OCR也可以支持疊圖／半疊嗎，不然有點浪費額度？（不知道9.0有沒有支援）

A：是的，叠图失败后，再次OCR是不能叠图了，比较浪费额度。如果发现間隔標記丟失经常出现，应当及时终止ocr，更换ocr厂家，或改成半叠。叠图失败的原因一般是字幕太模糊导致。

我看了知乎的留言，好像有點道理，雖然我不知道他為什麼會提取到一兩千張廢圖，但我記得esrXP的刪合窗有一個功能是「僅顯示已標記字幕」，不知道會否將此功能加進來？

A：废图多，是用了VSF5.6版，以及没有设置color filter导致。其实是因为没有正确使用VSF，不能代表多数用户情形。

fuyouquan · 发表于 2022-4-6 05:58:59

本帖最后由 fuyouquan 于 2022-4-6 09:56 编辑

乂MAN哥乂发表于 2022-4-6 00:46
雖然這方法挺方便，但不知道能不能再簡化一點？
例如開啟SUP或SUB+IDX後，可以自動選擇「圖像名稱以時間碼 ...

我升级vsf到5.6以后废图确实多了，尤其是识别小分辨率的视频。

如果subtitle可以直接将图形字幕导出到跟vsf识别出来的RGBimage兼容的形式，那我是够用了。不过楼主的用户手册要update一下提醒新用户喽。

更新一下，导出“名称带时间码图片”的功能在subtitle edit更到3.6.5之后才有

fuyouquan · 发表于 2022-4-6 09:52:56

乂MAN哥乂发表于 2022-4-5 23:23
sup、idx+sub好像不用弄了，我找到了最簡單的方法：
把sup或idx+sub丟進SubtitleEdit，在OCR文字區按右鍵> ...

导出带时间码的功能还是se更新到3.6.5之后才新增的
我说怎么之前没见过呢，看到你这个回帖才把SE从3.6.4更到3.6.5试一下看

乂MAN哥乂 · 发表于 2022-4-6 13:33:12

本帖最后由乂MAN哥乂于 2022-4-6 15:38 编辑

hx168 发表于 2022-4-6 00:56
雖然這方法挺方便，但不知道能不能再簡化一點？
例如開啟SUP或SUB+IDX後，可以自動選擇「圖像名稱以時間碼 ...

怎麼增加了Notepad+查找替換就刪除了導入SRT…
我平常都是OCR完成後生成SRT簡轉繁後用SubtitleEdit的多重取代再導入SRT來校對的…
Notepad+的查找替換對我沒什麼用，好像沒有SubtitleEdit的多重取代功能。

這個是因為有些用戶想要txt檔，所以一起生成了，關閉就好

那請問能把生成txt轉變為可選功能嗎

這個要研究一下，工作量太大就不好做，我用python確實可以做類似pyautogui的工作（查找替換就是一個例子）
導出不同字幕軌，導出到不同目錄，用戶應該都有需求，比較難統一

不同字幕軌是可以在SubtitleEdit中選擇的，導出到不同目錄可以選擇用戶在硬字幕提取工具裡他們所選擇的圖片文件區，例如有些人將圖片文件區設定為RGBImages，就用RGBImages文件夾，如果是ILAImages就用ILAImages文件夾。

8.0版本的3月14日更新壓縮包被微軟防毒判定為特洛伊木馬，但解壓後軟件掃毒沒有檢測到病毒，會否再重新壓縮上傳一次？

hx168 · 发表于 2022-4-6 15:59:40

本帖最后由 hx168 于 2022-4-8 01:24 编辑

乂MAN哥乂发表于 2022-4-6 13:33
怎麼增加了Notepad+查找替換就刪除了導入SRT…
我平常都是OCR完成後生成SRT簡轉繁後用SubtitleEdit的多重 ...

导入SRT，我以为没什么人用，既然你想用，我在“生成SRT”按键上加一个rightclick可以导入SRT。界面不够空间不想再调界面了。导入SRT，可以允许在SubtitleEdit里做转换、替换、调轴，但是不允许删除，否则导入后文字会对不上图片。
将在下一个更新提供此功能。

314更新我用火绒查毒没问题，你可放心使用。
有些查毒软件容易误报。
https://www.virustotal.com/gui/home/upload
误报原因：
https://blog.csdn.net/wyongqing/ ... tm_relevant_index=2

更新：0408更新支持txt档生成可选了。恢复支持导入SRT，在生成SRT键鼠标右键菜单中，可以试试。

fuyouquan · 发表于 2022-4-6 16:16:38

hx168 发表于 2022-4-6 15:59
导入SRT，我以为没什么人用，既然你想用，我在“生成SRT”按键上加一个rightclick可以导入SRT。界面不够 ...

我大概终于看懂你们在讨论什么功能了。
是识别完之后，知道有哪些字可能识别错了，并且错了很多次，想先导出srt批量更改完再导回来校对吗？
我遇到过这种问题，我的处理办法是用emeditor直接批量处理：

乂MAN哥乂 · 发表于 2022-4-6 16:47:52

fuyouquan 发表于 2022-4-6 16:16
我大概终于看懂你们在讨论什么功能了。
是识别完之后，知道有哪些字可能识别错了，并且错了很多次，想先 ...

SubtitleEdit的多重取代可以查看替換規則有沒有誤殺正常文字，如果有就可以取消勾選而不替換該行文字。
螢幕擷取畫面 2022-04-06 164359.png

hx168 · 发表于 2022-4-6 23:12:16

本帖最后由 hx168 于 2022-4-8 01:25 编辑

fuyouquan 发表于 2022-4-6 05:58
我升级vsf到5.6以后废图确实多了，尤其是识别小分辨率的视频。

如果subtitle可以直接将图形字幕导出到跟v ...

好的，我会更新用户使用手册。
现在SE导出的图片尺寸有大有小，不能直接叠图，我正在想能不能也支持叠图。。。0408更新：已能支持叠图。

		自动登录	找回密码
密码			立即注册

硬字幕提取工具10.0 - 超好用（”语音提词2.0”发布了！欢迎试用）

浏览过的版块

崭露头角

新人登场