不如来看看隔壁的 extract-subtitles？ #7

duangsuse · 2020-04-22T05:58:28Z

https://github.com/duangsuse-valid-projects/extract-subtitles

这个是我改的，原作者比较学院派，没有那些 fixed rate 什么的，主要是 absdiff(m1, m2) 和 scipy.signal.argrelextrema 提取关键帧(key frame)

也就是说没有这种算法：

for frame_no in range(0, video.getprop(cv2.CAP_PROP_FRAME_COUNT), cfg.step):
  video.setprop(cv2.CAP_PROP_POS_FRAMES, frame_no)
  imwrite(f"{frame_no}.png", video.read()[1])

OCR 当然是 PyTesseract ，一个本地的 OCR。去重的话不是在字幕区图像上面去重，是在文字上应用编辑距离算法。

效果请参看 https://t.me/dsuset/7167

此外你的这个描述… 有点不准确吧

video-to-text-ocr-demo/README.md

Line 12 in c853d8b

 一是防止结果重复；二是能把固定位置的文字收敛（比如台标），避免字幕定位错误。 

什么叫做『收敛』…… 这个名词好像是常用在机器学习领域，另外其实还有一种思路是预先裁剪好图像再去 OCR，因为字幕位置复杂的视频嘛… 一般会同时包含纵向字幕，这样即便一次提取完效果其实也不咋样。

像这样比较自动化的识别整个图像然后选 y 位置一致集合里最大的一组视为字幕也可以，如果要优化，你可以参考 extract-subtitle 的关键帧识别算法：

https://github.com/duangsuse-valid-projects/extract-subtitles/blob/64e1d1da376b1ec23740b6645c1b31f52620048d/extract_subtitles.py#L113-L143

The text was updated successfully, but these errors were encountered:

linbin0o0 · 2020-06-05T08:26:33Z

https://github.com/duangsuse-valid-projects/extract-subtitles

这个是我改的，原作者比较学院派，没有那些 fixed rate 什么的，主要是 absdiff(m1, m2) 和 scipy.signal.argrelextrema 提取关键帧(key frame)

也就是说没有这种算法：
for frame_no in range(0, video.getprop(cv2.CAP_PROP_FRAME_COUNT), cfg.step):
  video.setprop(cv2.CAP_PROP_POS_FRAMES, frame_no)
  imwrite(f"{frame_no}.png", video.read()[1])
OCR 当然是 PyTesseract ，一个本地的 OCR。去重的话不是在字幕区图像上面去重，是在文字上应用编辑距离算法。

效果请参看 https://t.me/dsuset/7167

此外你的这个描述… 有点不准确吧

video-to-text-ocr-demo/README.md

Line 12 in c853d8b

一是防止结果重复；二是能把固定位置的文字收敛（比如台标），避免字幕定位错误。

什么叫做『收敛』…… 这个名词好像是常用在机器学习领域，另外其实还有一种思路是预先裁剪好图像再去 OCR，因为字幕位置复杂的视频嘛… 一般会同时包含纵向字幕，这样即便一次提取完效果其实也不咋样。

像这样比较自动化的识别整个图像然后选 y 位置一致集合里最大的一组视为字幕也可以，如果要优化，你可以参考 extract-subtitle 的关键帧识别算法：

https://github.com/duangsuse-valid-projects/extract-subtitles/blob/64e1d1da376b1ec23740b6645c1b31f52620048d/extract_subtitles.py#L113-L143

你好，这个是不是只支持英文字幕的提取？

duangsuse · 2020-07-24T10:55:47Z

你好，这个是不是只支持英文字幕的提取？

OCR 其实只是提取字幕的最后一部分，我做完单帧位图的预处理（裁切、应用滤镜）后交给 OCR 库就可以了，pytesseract 是支持中文字幕的，在软件里也有『语言』命令行参数。

ghost · 2020-09-15T00:58:01Z

运行后出现错误

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

不如来看看隔壁的 extract-subtitles？ #7

不如来看看隔壁的 extract-subtitles？ #7

duangsuse commented Apr 22, 2020 •

edited

linbin0o0 commented Jun 5, 2020

duangsuse commented Jul 24, 2020

ghost commented Sep 15, 2020

不如来看看隔壁的 extract-subtitles？ #7

不如来看看隔壁的 extract-subtitles？ #7

Comments

duangsuse commented Apr 22, 2020 • edited

linbin0o0 commented Jun 5, 2020

duangsuse commented Jul 24, 2020

ghost commented Sep 15, 2020

duangsuse commented Apr 22, 2020 •

edited