查看: 42399|回覆: 113
收起左側

[教學] 使用Subtitle Edit軟體來OCR藍光sup檔案

  [複製連結]
發表於 2014-12-8 12:05:12 | 顯示全部樓層 |閱讀模式

馬上註冊,結交更多好友,享用更多功能,讓你輕鬆玩轉社區。

您需要 登錄 才可以下載或查看,沒有帳號?註冊

x
1.只針對sup檔案
2.至於1080P及720P(idx+sub),還是建議使用IdxSubOcr
3.免安裝Subtitle Edit 按此下載 http://www.videohelp.com/download/SubtitleEdit-3.4.4.zip
4.下載完成解壓縮,執行SubtitleEdit.exe
5.教學如下:
圖一
f-1.JPG

圖二
1.檔案-->滙入/OCR藍光字幕檔案(.sup)
2.設定如下
f-2.jpg

圖三
f-3.jpg

圖四
F-4.jpg

圖五
F-6.jpg

圖六
F-7.jpg

附註:OCR過程中,也許某些字元會要求重新辨識,但這個軟體對辨識SUP檔效果相當不錯!值得推薦!

評分

參與人數 1名聲 +6 精幣 +6 收起 理由
clubaudition + 6 + 6 熱心助人

查看全部評分

發表於 2014-12-8 21:12:23 | 顯示全部樓層
這不是得自己一個字一個字的打嗎 = = 因為本身沒有字庫
回覆 支持 反對

使用道具 檢舉

發表於 2014-12-8 22:38:20 | 顯示全部樓層
可以做個測試,相同的內容轉成sup後,增減陰影或黑框後是否仍可辨識…
回覆 支持 反對

使用道具 檢舉

發表於 2014-12-8 23:36:41 | 顯示全部樓層
clubaudition 發表於 2014-12-8 21:12
這不是得自己一個字一個字的打嗎 = = 因為本身沒有字庫

是啊!没字库的话,手动输入还不累死!?
回覆 支持 反對

使用道具 檢舉

發表於 2014-12-9 01:33:46 | 顯示全部樓層
本文章最後由 max8630 於 2014-12-9 01:40 編輯

剛剛下載來看了一下
其實他還是有具備字典功能的
選項->設定->字彙表
至於功能性如何我就懶的試了

補充
字彙表在Dictionaries資料夾內
另外它有一些外掛可以下載
至於功能我就不了解了
看起來它應用範圍好像還蠻廣的
回覆 支持 反對

使用道具 檢舉

發表於 2014-12-9 02:33:52 | 顯示全部樓層
http://www.hd.club.tw/thread-119694-1-1.html
2.png

1.png

這軟體三年前就已經測試過,當初只是測試mkv的功能不做它用,因OCR功能因太過於陽春就無視了,
而且一般軟體對"繁體中文"並不友善,官方所支援的字彙以及字典「不存在」中文的選項,不過可以自行手動加入,
anyway 每個人喜好的方式不同也不能完全否定這軟體的價值,也感謝樓主分享此OCR方式

回覆 支持 反對

使用道具 檢舉

 樓主| 發表於 2014-12-9 09:34:21 | 顯示全部樓層
1.關於字庫,當字庫愈辨識愈多,效果就會跟當初建SubToSrt字庫!
2.測試:OCR完畢Sex Tape,後OCR  Lucy 除了斜體花時間輸入外,其他令人滿意,效果不錯!(PS:Sex Tape跟Lucy兩個字型相近相似)
以上是我這幾天使用的心得,提供給各位參考!

評分

參與人數 1名聲 +10 精幣 +10 收起 理由
clubaudition + 10 + 10 熱心助人

查看全部評分

回覆 支持 反對

使用道具 檢舉

發表於 2014-12-9 09:44:22 | 顯示全部樓層
SubToSrt字庫可以分享,呃…
如果這軟體經識別後的字庫存在電腦裡,萬一電腦掛了…
                          
                                                     連掛2部電腦的人留

評分

參與人數 1名聲 +6 精幣 +6 收起 理由
clubaudition + 6 + 6 熱心助人

查看全部評分

回覆 支持 反對

使用道具 檢舉

發表於 2014-12-9 16:27:49 | 顯示全部樓層
本文章最後由 clubaudition 於 2014-12-9 16:30 編輯

以前摸索SubToSrt遇到瓶頸乾脆就放棄了,沒深入研究過  XD
有了字庫的辨識,應該正確率極高而且錯字極少,有時間再重新學習
感謝兩位經驗分享
回覆 支持 反對

使用道具 檢舉

發表於 2014-12-10 16:51:33 | 顯示全部樓層
本文章最後由 kiroro9999 於 2014-12-10 16:51 編輯

許久前使用SubRip+SubToSrt,但操作較繁複
且超過720X480無法辨識,另外只要字庫沒有的字形,幾乎都要重打一次

因此一直以來皆是使用IdxSubOcr
但IdxSubOcr的缺點是漏字及跳行,事後較正非常麻煩
最近重新學習SubRip,卻發生截取圖檔到99%就當掉(使用IdxSubOcr可正常辨識)
不知有沒有人知道問題點呢?

回覆 支持 反對

使用道具 檢舉

發表於 2014-12-10 16:54:50 | 顯示全部樓層
bebolan 發表於 2014-12-9 09:44
SubToSrt字庫可以分享,呃…
如果這軟體經識別後的字庫存在電腦裡,萬一電腦掛了…
                       ...

版上好像不少人是使用SubToSrt
如果可交流彼此的字庫,效率應該可以提升
回覆 支持 反對

使用道具 檢舉

發表於 2014-12-10 17:00:03 | 顯示全部樓層
before1012 發表於 2014-12-9 09:34
1.關於字庫,當字庫愈辨識愈多,效果就會跟當初建SubToSrt字庫!
2.測試:OCR完畢Sex Tape,後OCR  Lucy 除 ...

不知道能法把SubToSrt的字庫取出導入Subtitle Edit
回覆 支持 反對

使用道具 檢舉

發表於 2014-12-10 17:26:59 | 顯示全部樓層
本文章最後由 bebolan 於 2014-12-10 17:28 編輯
kiroro9999 發表於 2014-12-10 16:51
許久前使用SubRip+SubToSrt,但操作較繁複
且超過720X480無法辨識,另外只要字庫沒有的字形,幾乎都要重打 ...

試試SubRip1.2安裝版。subrip本來就只適用720x480。
回覆 支持 反對

使用道具 檢舉

 樓主| 發表於 2014-12-10 19:46:47 | 顯示全部樓層
1.這是我使用的subRip
https://drive.google.com/file/d/ ... lU/view?usp=sharing

2.這是我使用的subtosrt(含字庫)
https://drive.google.com/file/d/ ... EE/view?usp=sharing

免安裝解壓縮就可以用了!

**至於subtosrt字庫給Subtitle Edit使用,我想480P給1080P的字庫使用,不會很合適!**
**等Subtitle Edit字庫愈建愈多再分享出來,因為目前只OCR三部影片字幕,樣本太少**
回覆 支持 反對

使用道具 檢舉

發表於 2014-12-10 20:39:30 | 顯示全部樓層
本文章最後由 pleaze 於 2014-12-10 20:55 編輯
kiroro9999 發表於 2014-12-10 16:51
許久前使用SubRip+SubToSrt,但操作較繁複
且超過720X480無法辨識,另外只要字庫沒有的字形,幾乎都要重打 ...

超過 DVD 解析度(720X480)的 Sub,例如藍光版的 Sub 解析度是 1920X1080,可以利用 BDSup2Sub 把 Sub 解析度降轉成 720X480 ,就可以沒有問題地餵給 SubRip。不過,根據經驗,經降轉後的 Sub 對 SubToSrt 而言,幾乎成了全新字型(這也合理,我就只知道只有我會拿藍光 Sub 這麼幹),所以還是需要非常大量的輸入,但也有可能是我的字庫不夠多。不然,我就可以避開 IdxSubOcr 非常討厭的修正問題。
回覆 支持 反對

使用道具 檢舉

發表於 2014-12-10 22:25:49 | 顯示全部樓層
本文章最後由 pleaze 於 2014-12-10 22:27 編輯
before1012 發表於 2014-12-10 19:46
1.這是我使用的subRip
https://drive.google.com/file/d/0B0obT9O9CBQbQ3JuaUFBU09UblU/view?usp=sharing

我發現閣下 SubToSrt 下的 Replace.sys 檔案,內容幾乎空空如也,將我自己建的 Replace.sys 貼出來供參考。使用的方式就是直接將你用的 Replace.sys 給換掉,或者合併(如果你自己有建)。

這個 Replace.sys 本身是文字檔,主要功能是[字詞代換],例如剛剛有個將[侯爵]辨識成[候爵]。利用文字編輯器開這個檔,加入這麼一行 候爵<=>侯爵 ,往後字幕只要在 SubToSrt 內掃過一回,就會自動給校正回來。

我常將對岸的字幕,或者將 IdxSubOcr 剛辨識過的字幕丟到 SubToSrt ,先校正一遍,發現效果還不差,效率提高很多。

目前已建的字詞大約有六百多個,包括兩岸用詞的差異,IdxSubOcr 常見的辨識錯誤,陸續收集增加詞彙當中,不過收集速度實在不快,也很機車(有點煩)。
Replace.sys.rar (3.81 KB, 下載次數: 391)
回覆 支持 反對

使用道具 檢舉

發表於 2014-12-11 00:31:12 | 顯示全部樓層
本文章最後由 song4 於 2014-12-11 00:31 編輯
bebolan 發表於 2014-12-9 09:44
SubToSrt字庫可以分享,呃…
如果這軟體經識別後的字庫存在電腦裡,萬一電腦掛了…
                       ...


這是我取自網路上多位用家合併之後
達1079391條字幕
請享用链接: http://pan.baidu.com/s/1dDzUUJn 密码: r91o
回覆 支持 反對

使用道具 檢舉

發表於 2014-12-11 00:40:30 | 顯示全部樓層
pleaze 發表於 2014-12-10 22:25
我發現閣下 SubToSrt 下的 Replace.sys 檔案,內容幾乎空空如也,將我自己建的 Replace.sys 貼出來供參考 ...

謝謝pleaze大的replace.sys
剛才看了棒得沒話說
讚!!
回覆 支持 反對

使用道具 檢舉

發表於 2014-12-11 16:03:42 | 顯示全部樓層
before1012 發表於 2014-12-10 19:46
1.這是我使用的subRip
https://drive.google.com/file/d/0B0obT9O9CBQbQ3JuaUFBU09UblU/view?usp=sharing

感謝before1012的版本,已可順利使用
另外您的字庫真棒,真是太感謝了!
回覆 支持 反對

使用道具 檢舉

發表於 2014-12-11 16:13:41 | 顯示全部樓層
pleaze 發表於 2014-12-10 22:25
我發現閣下 SubToSrt 下的 Replace.sys 檔案,內容幾乎空空如也,將我自己建的 Replace.sys 貼出來供參考 ...


IdxSubOcr 辨識錯誤常見的一些詞我有在這一篇提到:
http://www.hd.club.tw/forum.php? ... p;extra=#pid1579955


下面這一篇,最下面的這些詞也可納進來:
https://sites.google.com/site/twbarry/04
回覆 支持 反對

使用道具 檢舉

您需要登錄後才可以回文 登錄 | 註冊

再次提醒,當您點擊發表回覆,視同您已經明白本討論區的版規,如不明白請先參見各版版規。

熱門推薦

再現導演傳奇-【BENQ-W1700粉墨登場】
再現導演傳奇-【BENQ-W170
4K元年的2017,相信消費者期待的是一台令眼睛為之一亮的機器。從
沙發靠牆-環繞喇叭位置
沙發靠牆-環繞喇叭位置
客廳沙發是靠牆的,寬度是330cm,高度是230cm, 目前是用圖中
小試身手就可以越級打怪-秦朝3115D
小試身手就可以越級打怪-
音響其實是比較級的東西,早期剛開始接觸沒幾年的時候都會有很比
Panasonic 50EX750改電源線問題
Panasonic 50EX750改電源
Panasonic 50EX750改電源線問題 請問圖中白色插在那可找到
電工發燒日記【家訪桃園藍綾兄】
電工發燒日記【家訪桃園藍
PART-1 幾年前小許對於劇院根本不在乎,認為劇院.. 跑跑audyss

聯絡我們| 問題反映| 小黑屋| 手機版| Archiver|  本網站特別聘請 蔡家豪律師 為本站法律顧問

快速回覆 返回頂部 返回列表