ls470211173 发表于 2023-2-13 09:26:01

硬字幕提取工具10.0-支持离线OCR、自动生成时间轴,生成字...

标题:硬字幕提取工具10.0-支持离线OCR、自动生成时间轴,生成字幕一条龙服务,附超详细教学

免责声明:

本免费工具仅供个人使用,为业余提取字幕的朋友提供方便,不可用于商业目的,不可侵犯他人知识产权。
同时,本工具利用了OCR服务商的免费额度,作者建议有长期大量需求的用户,请购买OCR服务商的额度,支持国家高科技发展。

一、 目前为止可行的硬字幕(hardsub)提取方案

这里只说“可行”的方案,那些不成熟的、按时收费的,用过就删的,不在此列。

1. 人工手提,用眼和手来提取时间轴和文字。
优点:准确率高(废话)。
缺点:费时费力,不能常做。

2. esrXP + IdxSubOcr(MODI OCR)
esrXP提取视频中带字幕的图片(从而也就提取了时间轴信息),打包成idx+sub文件,然后导入IdxSubOcr用微软MODI ocr识别文字,生成一个srt字幕文件。
优点:利用传统数字图像处理技术,获得字幕出现和消失的时间点,提取时间轴信息,准确率较高。
缺点:老掉牙的微软MODI ocr识别引擎准确率较低,为了照顾MODI ocr,esrXP需要做较多设置、试验、调整参数的工作,以便提供漂亮的黑底白字clearTxT给MODI ocr,这就很考验用户的经验了。总体来说使用门槛高、识别率较低、工作量较大。虽然esrXP已经停更多时,但是苦于没有更好的选择,长期以来字幕爱好者只能将就着用。

3. VideoSubFinder + ABBYY FineReader
VideoSubFinde做类似esrXP的工作(不同的是单独保存每个字幕图片,不打包成idx+sub文件),ABBYY FineReader 15做类似IdxSubOcr的工作,将每个jpg字幕图片ocr识别为一个txt文件,然后回到VideoSubFinder 将所有txt文件合成一个srt文件。
优点:跟esrXP类似,采用了更复杂的数字图像处理技术,提取视频中带字幕的图片和时间轴信息,更好的去重算法,准确率进一步提高。ABBYY FineReader 15除了能ocr中英文,还支持其他语种。
缺点:VideoSubFinder仍然基于传统的数字图像处理技术(灰度膨胀腐蚀轮廓色度亮度相似度),虽然能较好提取普通静态字幕(显示固定颜色固定,大多数视频中硬字幕皆属此类),但是对于一些动态字幕(显示变化颜色不定),难以提取。虽然暴露了很多参数给用户,但是参数繁多难以理解,普通用户只能用默认设置。
ABBYY FineReader 15离线文字ocr引擎,虽然比MODI ocr好得多,但在实际使用效果上,对比近年AI人工智能训练的识别引擎(例如百度OCR通用文字识别引擎),识别准确率还是差了一大截。

4. 硬字幕提取工具10
采用AI文字检测+传统的数字图像处理技术(保留支持VideoSubFinder老用户),提取字幕图片和时间轴信息,然后利用百度讯飞有道OCR通用文字识别云引擎+离线ocr引擎识别出文字,校对后生成srt字幕文件,最后还可选调用第三方工具APP(例如SubtitleEdit)做调轴补漏等工作,从开始到结束,整个字幕提取流程一气呵成,快速准确、识别率高、省时省力。

软件使用截图:


下载地址:
**** 本内容需购买 ****
软件使用详细教程:
因为教程过于详细,所以请下载观看:https://wwwo.lanzoum.com/iujlN0l0mkxc

435718680 发表于 2024-5-23 09:07:12

硬字幕提取工具10.0-支持离线OCR、自动生成时间轴

流通 发表于 2023-12-22 09:26:14

有用过的吗,来总结一下

kangyushi 发表于 2023-6-9 14:00:18

有用过的吗,说说使用感受

永遠の畫面 发表于 2023-6-1 11:40:26

大神真是多啊 什么都能做出来

bian888 发表于 2023-4-16 10:16:54

感谢分享 ,增长知识

ytl6916 发表于 2023-3-13 20:25:12

保存收藏辛苦您了

sangui1977 发表于 2023-2-21 17:23:24


感谢分享 眼花缭乱,增长知识

sangui1977 发表于 2023-2-21 16:55:40


保存收藏辛苦您了

cqtwtia 发表于 2023-2-18 18:51:14


保存收藏辛苦您了
页: [1] 2 3
查看完整版本: 硬字幕提取工具10.0-支持离线OCR、自动生成时间轴,生成字...