马上注册,享用更多功能。
您需要 登录 才可以下载或查看,没有账号?立即注册
x
标题:硬字幕提取工具10.0-支持离线OCR、自动生成时间轴,生成字幕一条龙服务,附超详细教学
免责声明:
本免费工具仅供个人使用,为业余提取字幕的朋友提供方便,不可用于商业目的,不可侵犯他人知识产权。
同时,本工具利用了OCR服务商的免费额度,作者建议有长期大量需求的用户,请购买OCR服务商的额度,支持国家高科技发展。
一、 目前为止可行的硬字幕(hardsub)提取方案
这里只说“可行”的方案,那些不成熟的、按时收费的,用过就删的,不在此列。
1. 人工手提,用眼和手来提取时间轴和文字。
优点:准确率高(废话)。
缺点:费时费力,不能常做。
2. esrXP + IdxSubOcr(MODI OCR)
esrXP提取视频中带字幕的图片(从而也就提取了时间轴信息),打包成idx+sub文件,然后导入IdxSubOcr用微软MODI ocr识别文字,生成一个srt字幕文件。
优点:利用传统数字图像处理技术,获得字幕出现和消失的时间点,提取时间轴信息,准确率较高。
缺点:老掉牙的微软MODI ocr识别引擎准确率较低,为了照顾MODI ocr,esrXP需要做较多设置、试验、调整参数的工作,以便提供漂亮的黑底白字clearTxT给MODI ocr,这就很考验用户的经验了。总体来说使用门槛高、识别率较低、工作量较大。虽然esrXP已经停更多时,但是苦于没有更好的选择,长期以来字幕爱好者只能将就着用。
3. VideoSubFinder + ABBYY FineReader
VideoSubFinde做类似esrXP的工作(不同的是单独保存每个字幕图片,不打包成idx+sub文件),ABBYY FineReader 15做类似IdxSubOcr的工作,将每个jpg字幕图片ocr识别为一个txt文件,然后回到VideoSubFinder 将所有txt文件合成一个srt文件。
优点:跟esrXP类似,采用了更复杂的数字图像处理技术,提取视频中带字幕的图片和时间轴信息,更好的去重算法,准确率进一步提高。ABBYY FineReader 15除了能ocr中英文,还支持其他语种。
缺点:VideoSubFinder仍然基于传统的数字图像处理技术(灰度膨胀腐蚀轮廓色度亮度相似度),虽然能较好提取普通静态字幕(显示固定颜色固定,大多数视频中硬字幕皆属此类),但是对于一些动态字幕(显示变化颜色不定),难以提取。虽然暴露了很多参数给用户,但是参数繁多难以理解,普通用户只能用默认设置。
ABBYY FineReader 15离线文字ocr引擎,虽然比MODI ocr好得多,但在实际使用效果上,对比近年AI人工智能训练的识别引擎(例如百度OCR通用文字识别引擎),识别准确率还是差了一大截。
4. 硬字幕提取工具10
采用AI文字检测+传统的数字图像处理技术(保留支持VideoSubFinder老用户),提取字幕图片和时间轴信息,然后利用百度讯飞有道OCR通用文字识别云引擎+离线ocr引擎识别出文字,校对后生成srt字幕文件,最后还可选调用第三方工具APP(例如SubtitleEdit)做调轴补漏等工作,从开始到结束,整个字幕提取流程一气呵成,快速准确、识别率高、省时省力。
软件使用截图:
下载地址:
软件使用详细教程:
因为教程过于详细,所以请下载观看:https://wwwo.lanzoum.com/iujlN0l0mkxc |