Skip to content

Latest commit

 

History

History
666 lines (428 loc) · 59.9 KB

README.zh-cn.md

File metadata and controls

666 lines (428 loc) · 59.9 KB

场景文本位置感知与识别的论文资源汇总

按发表机构排序: English, 简体中文.

按发表年份排序: English, 简体中文.

标记: [位置感知], [文字识别]

[位置感知] 从场景图片中检测出文字所在的区域

[文字识别] 识别出文字区域中的文字内容

最近更新时间:2023-09-17

1. 论文和代码

综述型论文

  • [2020-arxiv] Text Detection and Recognition in the Wild: A Review 论文
  • [2020-arxiv] Text Recognition in the Wild: A Survey 论文
  • [2020-IJCV] Scene Text Detection and Recognition: The Deep Learning Era 论文
  • [2019-ICCV] What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis 论文 代码
  • [2016-TIP] Text Detection Tracking and Recognition in Video: A Comprehensive Survey 论文
  • [2015-PAMI] Text Detection and Recognition in Imagery: A Survey 论文
  • [2014-Front.Comput.Sci] Scene Text Detection and Recognition: Recent Advances and Future Trends 论文

牛津大学

  • [2020-ECCV][位置感知][文字识别] Adaptive Text Recognition through Visual Matching 论文 代码
  • [2018-BMVC][文字识别] Inductive Visual Localisation: Factorised Training for Superior Generalisation 论文
  • [2016-IJCV][位置感知][文字识别] Reading Text in the Wild with Convolutional Neural Networks 论文 样例 主页
  • [2016-CVPR][位置感知] Synthetic Data for Text Localisation in Natural Images 论文 代码 数据
  • [2015-ICLR][文字识别] Deep structured output learning for unconstrained text recognition 论文
  • [2015-PhD Thesis][位置感知] Deep Learning for Text Spotting 论文 代码
  • [2014-ECCV][位置感知] Deep Features for Text Spotting 论文 代码 模型
  • [2014-NIPS][文字识别] Synthetic Data and Artificial Neural Networks for Natural Scene Text Recognition 论文 主页 模型

中国科学院深圳先进技术研究院

  • [2018-arxiv][位置感知][文字识别] FOTS: Fast Oriented Text Spotting with a Unified Network 论文
  • [2016-ECCV][位置感知] CTPN: Detecting Text in Natural Image with Connectionist Text Proposal Network 论文 代码
  • [2016-CVPR][位置感知] Accurate Text Localization in Natural Image with Cascaded Convolutional Text Network 论文
  • [2016-AAAI][位置感知][文字识别] Reading Scene Text in Deep Convolutional Sequences 论文
  • [2016-TIP][位置感知] Text-Attentional Convolutional Neural Networks for Scene Text Detection 论文
  • [2016-TIP][位置感知] Text-Attentional Convolutional Neural Network for Scene Text Detection 论文
  • [2014-ECCV][位置感知] Robust Scene Text Detection with Convolution Neural Network Induced MSER Trees 论文

华南理工大学

  • [2021-IJCV][位置感知] Exploring the Capacity of an Orderless Box Discretization Network for Multi-orientation Scene Text Detection 论文 代码
  • [2021-CVPR][位置感知] Fourier Contour Embedding for Arbitrary-Shaped Text Detection 论文
  • [2021-CVPR][文字识别][位置感知] Implicit Feature Alignment: Learn To Convert Text Recognizer to Text Spotter 论文 代码
  • [2020-CVPR][文字识别] Learn to Augment: Joint Data Augmentation and Network Optimization for Text Recognition 论文 代码
  • [2020-AAAI][文字识别][位置感知] Decoupled Attention Network for Text Recognition 论文
  • [2020-CVPR][位置感知][文字识别] ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-Curve Network 论文 代码
  • [2020-IJCV][文字识别] Separating Content from Style Using Adversarial Learning for Recognizing Text in the Wild 论文
  • [2019-Pattern Recognition][文字识别] A Multi-Object Rectified Attention Network for Scene Text Recognition 论文 代码
  • [2019-CVPR][文字识别] Aggregation Cross-Entropy for Sequence Recognition 论文 代码
  • [2019-arxiv][位置感知] Exploring the Capacity of an Orderless Box Discretization Network for Multi-orientation Scene Text Detection 论文 代码 代码
  • [2019-CVPR][位置感知] Tightness-Aware Evaluation Protocol for Scene Text Detection 论文
  • [2018-AAAI][位置感知] Feature Enhancement Network: A Refined Scene Text Detector 论文
  • [2017-arXiv][位置感知] Detecting Curve Text in the Wild: New Dataset and New Solution 论文
  • [2020-arxiv][文字识别] Adaptive Embedding Gate for Attention-Based Scene Text Recognition 论文
  • [2017-PAMI][文字识别] Learning Spatial-Semantic Context with Fully Convolutional Recurrent Network for Online Handwritten Chinese Text Recognition 论文
  • [2017-CVPR][位置感知] Deep Matching Prior Network: Toward Tighter Multi-oriented Text Detection 论文
  • [2016-arXiv][位置感知][文字识别] DeepText: A Unified Framework for Text Proposal Generation and Text Detection in Natural Images 论文
  • [2016-IEEE Transactions on Multimedia][位置感知] A Convolutional Neural Network Based Chinese Text Detection Algorithm Via Text Structure Modeling 论文

复旦大学

  • [2022-AAAI][文字识别] Text Gestalt: Stroke-Aware Scene Text Image Super-resolution 论文 代码
  • [2023-MM][文字识别] Chinese Character Recognition with Augmented Character Profile Matching 论文 代码
  • [2023-ICCV][文字识别] Chinese Text Recognition with A Pre-Trained CLIP-Like Model Through Image-IDS Aligning 论文 代码
  • [2023-arxiv][位置感知][文字识别] Weakly-Supervised Text Instance Segmentation 论文 代码
  • [2023-IJCAI][文字识别] Orientation-Independent Chinese Text Recognition in Scene Images 论文 代码
  • [2023-IJCAI][文字识别] TPS++: Attention-Enhanced Thin-Plate Spline for Scene Text Recognition 论文 代码
  • [2023-IJCAI][位置感知][文字识别] Towards Accurate Video Text Spotting with Text-wise Semantic Reasoning 论文 代码
  • [2022-MM][文字识别] Chinese Character Recognition with Augmented Character Profile Matching 论文 代码
  • [2022-WACV][文字识别] Robustly Recognizing Irregular Scene Text by Rectifying Principle Irregularities 论文
  • [2022-IJCAI][文字识别] C3-STISR: Scene Text Image Super-resolution with Triple Clues 论文 [代码][https://github.com/zhaominyiz/C3-STISR]
  • [2021-IJCAI][文字识别] Zero-Shot Chinese Character Recognition with Stroke-Level Decomposition 论文 代码
  • [2021-CVPR][文字识别] Scene Text Telescope: Text-Focused Scene Image Super-Resolution 论文
  • [2020-arxiv][文字识别] Text Recognition in Real Scenarios with a Few Labeled Samples 论文
  • [2018-CVPR][文字识别] Edit Probability for Scene Text Recognition 论文
  • [2017-arXiv][位置感知] Arbitrary-Oriented Scene Text Detection via Rotation Proposals 论文 代码

华中科技大学

  • [2021-CVPR][位置感知][文字识别] Scene Text Retrieval via Joint Text Detection and Similarity Learning 论文 代码
  • [2021-CVPR][位置感知] MOST: A Multi-Oriented Scene Text Detector With Localization Refinement 论文
  • [2020-ECCV][文字识别] AutoSTR: Efficient Backbone Search for Scene Text Recognition 论文
  • [2020-AAAI][文字识别][位置感知] All You Need Is Boundary: Toward Arbitrary-Shaped Text Spotting 论文
  • [2020-AAAI][文字识别][位置感知] Real-time Scene Text Detection with Differentiable Binarization 论文 代码
  • [2020-ECCV][位置感知][文字识别] Mask TextSpotter V3: Segmentation Proposal Network for Robust Scene Text Spotting 论文 代码
  • [2019-PAMI][文字识别] ASTER: An Attentional Scene Text Recognizer with Flexible Rectification 论文 代码
  • [2019-AAAI][文字识别] Scene Text Recognition from Two-Dimensional Perspective 论文
  • [2019-PAMI][位置感知] Gliding vertex on the horizontal bounding box for multi-oriented object detection 论文 代码
  • [2019-ICCV][文字识别] Symmetry-Constrained Rectification Network for Scene Text Recognition 论文
  • [2018-arxiv][位置感知] Detecting Text in the Wild with Deep Character Embedding Network 论文 代码
  • [2018-ECCV][文字识别][位置感知] Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes 论文
  • [2018-ICIP][位置感知] Feature Fusion Network for Scene Text Detection 论文
  • [2018-CVPR][位置感知] Multi-Oriented Scene Text Detection via Corner Localization and Region Segmentation 论文
  • [2018-CVPR][位置感知] Rotation-sensitive Regression for Oriented Scene Text Detection 论文
  • [2018-TIP][位置感知] TextBoxes++: A Single-Shot Oriented Scene Text Detector 论文 代码
  • [2017-AAAI][位置感知] TextBoxes: A Fast TextDetector with a Single Deep Neural Network 论文 代码
  • [2017-CVPR][位置感知] Detecting Oriented Text in Natural Images by Linking Segments 论文 代码
  • [2016-CVPR][文字识别] Robust scene text recognition with automatic rectification 论文
  • [2016-arXiv][位置感知] Scene Text Detection via Holistic, Multi-Channel Prediction 论文
  • [2016-CVPR][位置感知] Multi-oriented text detection with fully convolutional networks 论文
  • [2015-PAMI][文字识别] An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 论文 代码 代码
  • [2015-CVPR][位置感知] Symmetry-Based Text Line Detector in Natural Scenes 论文 代码
  • [2015-ICDAR][文字识别] Automatic Script Identification in the Wild 论文
  • [2014-CVPR][文字识别] Strokelets: A Learned Multi-Scale Representation for Scene Text Recognition 论文

巴塞罗那自治大学

  • [2019-ICCV][位置感知][文字识别] Scene Text Visual Question Answering 论文
  • [2018-ECCV][位置感知] Single Shot Scene Text Retrieval 论文
  • [2017-arXiv][位置感知] Improving Text Proposal for Scene Images with Fully Convolutional Networks 论文
  • [2016-arXiv][位置感知] TextProposals: a Text-specific Selective Search Algorithm for Word Spotting in the Wild 论文 代码
  • [2015-ICDAR][位置感知] Object Proposals for Text Extraction in the Wild 论文 代码
  • [2014-PAMI][文字识别] Word Spotting and Recognition with Embedded Attributes 论文 主页 代码

斯坦福大学

  • [2012-ICPR][文字识别] End-to-End Text Recognition with Convolutional Neural Networks 论文 代码 SVHN 数据集
  • [2012-PhD thesis][文字识别] End-to-End Text Recognition with Convolutional Neural Networks 论文

首尔大学

  • [2017-AAAI][位置感知][文字识别] Detection and Recognition of Text Embedding in Online Images via Neural Context Models 论文

旷视科技: Face++

  • [2020-CVPR][文字识别] On Vocabulary Reliance in Scene Text Recognition 论文
  • [2020-AAAI][文字识别][位置感知] TextScanner: Reading Characters in Order for Robust Scene Text Recognition 论文
  • [2017-CVPR][位置感知] EAST: An Efficient and Accurate Scene Text Detector 论文 代码 增强版代码

中国科学院自动化研究所

  • [2020-IJCV][位置感知][文字识别] Residual Dual Scale Scene Text Spotting by Fusing Bottom-Up and Top-Down Processing 论文
  • [2019-CVPR][文字识别] Sequence-to-Sequence Domain Adaptation Networkfor Robust Text Image Recognition 论文
  • [2019-ICCV][位置感知][文字识别] TextDragon: An End-to-End Framework for Arbitrary Shaped Text Spotting 论文
  • [2018-arxiv][文字识别] NRTR: A No-Recurrence Sequence-to-Sequence Model For Scene Text Recognition 论文 代码
  • [2018-arxiv][文字识别] SCAN: Sliding Convolutional Attention Network for Scene Text Recognition 论文 代码
  • [2018-arxiv][文字识别] Recurrent Calibration Network for Irregular Text Recognition 论文
  • [2017-arxiv][文字识别] Scene Text Recognition with Sliding Convolutional Character Models 论文 代码
  • [2017-arXiv][位置感知] Deep Direct Regression for Multi-Oriented Scene Text Detection 论文
  • [2017-IAPR][位置感知] Scene Text Detection with Novel Superpixel Based Character Candidate Extraction 论文

加州大学圣地亚哥分校

  • [2016-CVPR][文字识别] Recursive Recurrent Nets with Attention Modeling for OCR in the Wild 论文

加州大学圣克鲁兹分校

  • [2017-arXiv][位置感知] Cascaded Segmentation-Detection Networks for Word-Level Text Spotting 论文

康奈尔大学

  • [2016-arXiv][位置感知][文字识别] COCO-Text: Dataset and Benchmark for Text Detection and Recognition in Natural Images 论文

宾夕法尼亚州立大学

  • [2017-WACV][位置感知] TextContourNet: A Flexible and Effective Framework for Improving Scene Text Detection Architecture With a Multi-Task Cascade 论文
  • [2016-PhD Thesis][位置感知] Context Modeling for Semantic Text Matching and Scene Text Detection 论文

北京科技大学

  • [2021-ICCV][位置感知] Adaptive Boundary Proposal Network for Arbitrary Shape Text Detection 论文 代码
  • [2020-CVPR][位置感知] Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection 论文
  • [2017-arxiv][文字识别] AdaDNNs: Adaptive Ensemble of Deep Neural Networks for Scene Text Recognition 论文
  • [2016-IJCAI][位置感知] Scene Text Detection in Video by Learning Locally and Globally 论文
  • [2014-PAMI][文字识别] Robust Text Detection in Natural Scene Images 论文

浦项工科大学

  • [2016-CVPR][位置感知] CannyText Detector: Fast and Robust Scene Text Localization Algorithm 论文

法国高等信息工程师学院

  • [2016-IJDAR][位置感知] TextCatcher: a method to detect curved and challenging text in natural scenes 论文

捷克理工大学

  • [2018-ACCV][位置感知][文字识别] E2E-MLT - an Unconstrained End-to-End Method for Multi-Language Scene Text 论文 代码
  • [2017-ICCV][位置感知][文字识别] Deep TextSpotter: An End-to-End Trainable Scene Text Localization and Recognition Framework 论文 代码
  • [2015-PAMI][位置感知][文字识别] Real-time Lexicon-free Scene Text Localization and Recognition 论文
  • [2015-ICCV][位置感知] FASText: Efficient unconstrained scene text detector 论文 代码
  • [2012-CVPR][位置感知][文字识别] Real-time scene text localization and recognition 论文 代码

Google

  • [2019-ICCV][位置感知][文字识别] Towards Unconstrained End-to-End Text Spotting 论文
  • [2013-ICCV][位置感知][文字识别] Photo OCR: Reading Text in Uncontrolled Conditions 论文

微软

  • [2017-ICCV][位置感知] WordSup: Exploiting Word Annotations for Character based Text Detection 论文
  • [2010-CVPR][位置感知] SWT: Detecting Text in Natural Scenes with Stroke Width Transform 论文 代码

三星中国研究院

  • [2019-CVPR][位置感知] Arbitrary Shape Scene Text Detection With Adaptive Text Region Representation 论文
  • [2017-arXiv][位置感知] R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection 论文
  • [2017-IAPR][位置感知] Deep Residual Text Detection Network for Scene Text 论文

Vicarious FPC Inc

  • [2016-NIPS][文字识别] Generative Shape Models: Joint Text Recognition and Segmentation with Very Little Training Data 论文

复杂系统管理与控制国家重点实验室(中国)

  • [2013-CVPR][文字识别] Scene Text Recognition using Part-based Tree-structured Character Detection 论文

印度联邦理工大学

  • [2012-CVPR][文字识别] top-down and bottom-up cues for scene text recognition 论文

斯坦福大学

  • [2012-ICPR][文字识别] End-to-End Text Recognition with CNN 论文 代码

Infocomm研究所, 视觉计算组

  • [2017-ICCV][位置感知] WeText: Scene Text Detection under Weak Supervision 论文

弗罗里达大学

  • [2017-ICCV][位置感知] Single Shot Text Detector with Regional Attention 论文 代码

南加州大学

  • [2017-ICCV][位置感知] Self-organized Text Detection with Minimal Post-processing via Border Learning 论文

海康威视研究院

  • [2021-AAAI][位置感知][文字识别] MANGO: A Mask Attention Guided One-Stage Scene Text Spotter 论文
  • [2020-AAAI][文字识别][位置感知] Text Perceptron: Towards End-to-End Arbitrary-Shaped Text Spotting 论文
  • [2018-CVPR][文字识别] AON: Towards Arbitrarily-Oriented Text Recognition 论文 代码
  • [2017-ICCV][文字识别] Focusing Attention: Towards Accurate Text Recognition in Natural Images 论文

阿德莱德大学

  • [2019-AAAI][文字识别] Show, Attend and Read: A Simple and Strong Baseline for Irregular Text Recognition 论文 代码
  • [2017-ICCV][位置感知][文字识别] Towards End-to-end Text Spotting with Convolutional Recurrent Neural Networks 论文

纽约城市大学

  • [2017-CVPR][位置感知] Unambiguous Text Localization and Retrieval for Cluttered Scenes 论文

香港大学

  • [2020-ECCV][位置感知][文字识别] AE TextSpotter: Learning Visual and Linguistic Representation for Ambiguous Text Spotting 论文
  • [2018-AAAI][文字识别] Char-Net: A Character-Aware Neural Network for Distorted Scene Text 论文

浙江大学

  • [2021-TIP][位置感知][文字识别] FREE: A Fast and Robust End-to-End Video Text Spotter 论文
  • [2020-arxiv][文字识别] Refined Gate: A Simple and Effective Gating Mechanism for Recurrent Units 论文
  • [2018-AAAI][位置感知] PixelLink: Detecting Scene Text via Instance Segmentation 论文

波茨坦大学

  • [2018-AAAI][位置感知][文字识别] SEE: Towards Semi-Supervised End-to-End Scene Text Recognition 论文 代码

亚利桑那州立大学

  • [2018-AAAI][文字识别] SqueezedText: A Real-time Scene Text Recognition by Binary Convolutional Encoder-decoder Network 论文

史蒂文斯理工学院

  • [2018-CVPR][位置感知] Geometry-Aware Scene Text Detection with Instance Transformation Network 论文

南洋理工大学

  • [2020-IJCV][位置感知] Bottom-Up Scene Text Detection with Markov Clustering Networks 论文
  • [2020-AAAI][文字识别][位置感知] GTC: Guided Training of CTC Towards Efficient and Accurate Scene Text Recognition 论文
  • [2019-ICCV][位置感知][文字识别] GA-DAN: Geometry-Aware Domain Adaptation Network for Scene Text Detection and Recognition 论文
  • [2019-CVPR][位置感知] ESIR: End-To-End Scene Text Recognition via Iterative Image Rectification 论文
  • [2019-CVPR][位置感知] Towards Robust Curve Text Detection With Conditional Spatial Expansion 论文
  • [2018-ECCV][位置感知] Verisimilar Image Synthesis for Accurate Detection and Recognition of Texts in Scenes 论文
  • [2018-ECCV][位置感知] Accurate Scene Text Detection through Border Semantics Awareness and Bootstrapping 论文
  • [2018-ECCV][位置感知] Using Object Information for Spotting Text 论文
  • [2018-CVPR][位置感知] Learning Markov Clustering Networks for Scene Text Detection 论文

阿里巴巴集团

  • [2018-ICPR][位置感知][文字识别] A Novel Integrated Framework for Learning both Text Detection and Recognition 论文
  • [2018-IJCAI][位置感知] IncepText: A New Inception-Text Module with Deformable PSROI Pooling for Multi-Oriented Scene Text Detection 论文

中国科学院

  • [2020-CVPR][位置感知][文字识别] Multi-Modal Graph Neural Network for Joint Reasoning on Vision and Scene Text 论文
  • [2018-ICIP][位置感知] Focal Text: An Accurate Text Detection With Focal Loss 论文
  • [2018-ICIP][位置感知] Dense Chained Attention Network for Scene Text Recognition 论文

剑桥大学

  • [2018-ECCV][位置感知] Synthetically Supervised Feature Learning for Scene Text Recognition 论文

北京大学

  • [2021-NIPS][位置感知] CentripetalText: An Efficient Text Instance Representation for Scene Text Detection 论文 代码
  • [2020-ICASSP][文字识别] A New Perspective for Flexible Feature Gathering in Scene Text Recognition Via Character Anchor Pooling 论文
  • [2020-ICASSP][位置感知] All you need is a second look: Towards Tighter Arbitrary shape text detection 论文
  • [2019-WACV][位置感知] Mask R-CNN with Pyramid Attention Network for Scene Text Detection 论文
  • [2018-ECCV][位置感知] TextSnake: A Flexible Representation for Detecting Text of Arbitrary Shapes 论文 代码

商汤研究院

  • [2021-WACV][位置感知] Disentangled Contour Learning for Quadrilateral Text Detection 论文 代码
  • [2020-ECCV][文字识别] RobustScanner: Dynamically Enhancing Positional Clues for Robust Text Recognition 论文
  • [2020-ECCV][文字识别] Scene Text Image Super-resolution in the wild 论文
  • [2019-arxiv][位置感知] Pyramid Mask Text Detector 论文
  • [2019-ICCV][位置感知] Geometry Normalization Networks for Accurate Scene Text Detection 论文
  • [2018-BMVC][位置感知] Boosting up Scene Text Detectors with Guided CNN 论文

NAVER Clova 研究院

  • [2020-ECCV][位置感知] Character Region Attention For Text Spotting 论文
  • [2019-CVPR][位置感知][文字识别] Character Region Awareness for Text Detection 论文 代码

百度

  • [2020-arxiv]位置感知][文字识别] PP-OCR: A Practical Ultra Lightweight OCR System 论文
  • [2019-ICCV][位置感知][文字识别] Chinese Street View Text: Large-Scale Chinese Text Reading With Partially Supervised Learning 论文
  • [2019-CVPR][位置感知] Look More Than Once: An Accurate Detector for Text of Arbitrary Shapes 论文
  • [2018-arxiv][位置感知] Detecting Text in the Wild with Deep Character Embedding Network 论文
  • [2018-ACCV][位置感知][文字识别] TextNet: Irregular Text Reading from Images with an End-to-End Trainable Network 论文

阿德莱德大学

  • [2018-CVPR][位置感知][文字识别] An End-to-End TextSpotter with Explicit Alignment and Attention 论文 代码

南京大学

  • [2020-BMVC][文字识别] Robust Scene Text Recognition Through Adaptive Image Enhancement 论文
  • [2019-ICCV][位置感知] Efficient and Accurate Arbitrary-Shaped Text Detection With Pixel Aggregation Network 论文 代码
  • [2019-CVPR][位置感知] Shape Robust Text Detection With Progressive Scale Expansion Network 论文 代码

香港中文大学

  • [2022-AAAI][文字识别] Context-based Contrastive Learning for Scene Text Recognition 论文
  • [2019-CVPR][位置感知] Learning Shape-Aware Embedding for Scene Text Detection 论文

码隆科技

  • [2019-ICCV][位置感知][文字识别] Convolutional Character Networks 论文 代码

罗切斯特大学

  • [2019-ICCV][文字识别] Large-Scale Tag-Based Font Retrieval With Generative Feature Learning 论文

Facebook AI Research

  • [2021-CVPR][位置感知][文字识别] TextOCR: Towards Large-Scale End-to-End Reasoning for Arbitrary-Shaped Scene Text 论文 代码
  • [2020-CVPR][位置感知][文字识别] Iterative Answer Prediction with Pointer-Augmented Multimodal Transformers for TextVQA 论文
  • [2018-arxiv][位置感知] Improving Rotated Text Detection with Rotation Region Proposal Networks 论文

马里兰大学

  • [2020-WACV][文字识别] Adapting Style and Content for Attended Text Sequence Recognition 论文

Penta-AI

  • [2020-WACV][位置感知] It’s All About The Scale - Efficient Text Detection Using Adaptive Scaling 论文

华中师范大学

  • [2020-ECCV][位置感知][文字识别] PlugNet: Degradation Aware Scene Text Recognition Supervised by a Pluggable Super-Resolution Unit 论文

腾讯

  • [2022-AAAI][文字识别] Perceiving Stroke-Semantic Context: Hierarchical Contrastive Learning for Robust Scene Text Recognition 论文
  • [2020-arxiv][位置感知] PuzzleNet: Scene Text Detection by Segment Context Graph Learning 论文
  • [2020-AAAI][文字识别][位置感知] Accurate Structured-Text Spotting for Arithmetical Exercise Correction 论文
  • [2019-arxiv][文字识别] 2D Attentional Irregular Scene Text Recognizer 论文 代码

清华大学

  • [2023-IJCAI][文字识别] Towards Robust Scene Text Image Super-resolution via Explicit Location Enhancement 论文 代码
  • [2021-CVPR][位置感知] Primitive Representation Learning for Scene Text Recognition 论文
  • [2020-ECCV][位置感知] Sequential Deformation for Accurate Scene Text Detection 论文

中国科技大学

  • [2023-IJCAI][文字识别] Linguistic More: Taking a Further Step toward Effcient and Accurate Scene Text Recognition 论文 代码
  • [2021-ICCV][文字识别] From Two to One: A New Scene Text Recognizer With Visual Language Modeling Network 论文
  • [2021-CVPR][位置感知] Read Like Humans: Autonomous, Bidirectional and Iterative Language Modeling for Scene Text Recognition 论文 代码
  • [2020-CVPR][位置感知] ContourNet: Taking a Further Step Toward Accurate Arbitrary-Shaped Scene Text Detection 论文 代码
  • [2018-Pattern Recognition][位置感知] TextMountain: Accurate Scene Text Detection via Instance Segmentation 论文

电子科技大学

  • [2020-CVPR][文字识别] What Machines See Is Not What They Get: Fooling Scene Text Recognition Models With Adversarial Text Images 论文
  • [2019-arxiv][文字识别] Focus-Enhanced Scene Text Recognition with Deformable Convolutions 论文 代码
  • [2018-Pattern Recognition][位置感知] TextMountain: Accurate Scene Text Detection via Instance Segmentation 论文

印度统计大学

  • [2020-CVPR][位置感知][文字识别] STEFANN: Scene Text Editor Using Font Adaptive Neural Network 论文

中国科学院信息工程研究所

  • [2021-CVPR][位置感知] Progressive Contour Regression for Arbitrary-Shape Scene Text Detection 论文 代码
  • [2020-CVPR][文字识别] SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition 论文
  • [2020-ICPR][文字识别] Gaussian Constrained Attention Network for Scene Text Recognition 论文
  • [2020-arxiv][位置感知] Self-Training for Domain Adaptive Scene Text Detection 论文
  • [2019-ICDAR][位置感知] Curved Text Detection in Natural Scene Images with Semi- and Weakly-Supervised Learning 论文
  • [2019-BMVC][文字识别] Text Recognition using local correlation论文

中国科学院大学

  • [2020-CVPR][位置感知][文字识别] Towards Accurate Scene Text Recognition With Semantic Reasoning Networks 论文

亚马逊

  • [2020-CVPR][位置感知] SCATTER: Selective Context Attentional Scene Text Recognizer 论文

新德里理工学院

  • [2020-ICIP][位置感知] Scale-invariant Multi-oriented Text Detection in Wild Scene Images 论文

印度理工学院

  • [2020-arxiv][位置感知] NENET: An Edge Learnable Network for Link Prediction in Scene Text 论文

西安电子科技大学

  • [2021-AAAI][位置感知][文字识别] PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering Network 论文 代码
  • [2020-ICASSP][位置感知] Efficient Scene Text Detection with Textual Attention Tower 论文
  • [2019-ACM-MM][位置感知] A Single-Shot Arbitrarily-Shaped Text Detector based on Context Attended Multi-Task Learning 论文

同济大学

  • [2019-AAAI][位置感知] Scene Text Detection with Supervised Pyramid Context Network 论文 代码

哈尔滨工业大学

上海交通大学

  • [2018-ICPR][位置感知] Fused Text Segmentation Networks for Multi-oriented Scene Text Detection 论文

平安财险

  • [2020-arxiv][文字识别] Hamming OCR: A Locality Sensitive Hashing Neural Network for Scene Text Recognition 论文

合肥工业大学

  • [2020-arxiv][文字识别] Fast Dense Residual Network: Enhancing Global Dense Feature Flow for Text Recognition 论文

北京航空航天大学

  • [2020-arxiv][文字识别] A Feasible Framework for Arbitrary-Shaped Scene Text Recognition 论文 [代码](https: //github.com/zhang0jhon/AttentionOCR)

波士顿大学

  • [2020-arxiv][文字识别] Deep Neural Network for Semantic-based Text Recognition in Images 论文

卡内基梅隆大学

  • [2019-ICDAR][文字识别] Rethinking Irregular Scene Text Recognition 论文 代码

西北工业大学

  • [2019-CVPR][位置感知][文字识别] Towards End-to-End Text Spotting in Natural Scenes 论文

VinAI 研究院

  • [2021-CVPR][位置感知] Dictionary-Guided Scene Text Recognition 论文 代码

东京大学

  • [2021-CVPR][文字识别] What if We Only Use Real Datasets for Scene Text Recognition? Toward Scene Text Recognition With Fewer Labels 论文 代码

萨里大学

  • [2021-ICCV][文字识别] Towards the Unseen: Iterative Text Recognition by Distilling from Errors 论文
  • [2021-ICCV][文字识别] Joint Visual Semantic Reasoning: Multi-Stage Decoder for Text Recognition 论文
  • [2021-CVPR][文字识别] MetaHTR: Towards Writer-Adaptive Handwritten Text Recognition 论文

Technion-以色列理工学院

  • [2021-CVPR][文字识别] Sequence-to-Sequence Contrastive Learning for Text Recognition 论文

伊利诺伊大学厄巴纳-香槟分校

  • [2021-CVPR][文字识别] Rethinking Text Segmentation: A Novel Dataset and a Text-Specific Refinement Approach 论文 代码

中国科学院大学-模式识别国家重点实验室

  • [2021-CVPR][位置感知] Semantic-Aware Video Text Detection 论文

深圳大学

  • [2021-CVPR][位置感知][文字识别] Self-Attention Based Text Knowledge Mining for Text Detection 论文 代码

菲律宾大学

  • [2021-ICDAR][文字识别] Vision Transformer for Fast and Efficient Scene Text Recognition 论文 代码

北京交通大学

  • [2022-IJCAI][文字识别] SVTR: Scene Text Recognition with a Single Visual Model 论文 代码

武汉大学

  • [2022-AAAI][文字识别] Visual Semantics Allow for Textual Reasoning Better in Scene Text Recognition 论文 代码

Helsing AI

  • [2022-WACV][文字识别] One-shot Compositional Data Generation for Low Resource Handwritten Text Recognition 论文

普渡大学

  • [2023-WACV][文字识别] Seq-UPS: Sequential Uncertainty-aware Pseudo-label Selection for Semi-Supervised Text Recognition 论文

2. 训练数据集合

用途: 文本感知(不同形状的文本),识别

下载

1,555 图片, 每个图片至少3个不同文本方向,以及其排布曲线

用途: 文本感知(不同形状的文本),识别

下载

21,384 图片, 21,384+ 文本标记

用途: 文本感知,识别

下载

63,686 图片, 173,589 文本标记, 3 细粒度文本参数.

用途: 文本感知,识别

下载

涵括9万英语单词的的9百万张图片

用途: 文本识别,分割

下载

街景数字位置定位与识别数据库。73257张训练图,26032测试图,531131额外功用图

用途: 数字文本位置定为, 数字文字识别

下载

5000张带文本的场景 (2000张用于训练,3000张用于测试)

文本图片都被裁剪出来并标记出相应的大小写敏感的文本

用途: 文本识别

下载

包含62个字符的小尺寸图片 (0-9, a-z, A-Z) 每张图只包含少量字符

用途: 文本识别

下载

500张自然场景图片 (图片大小从 1296x864 到 1920x1280不等)

中文英文及其混合的图片

用途: 文本感知

350高分辨率图片 (平均尺寸为 1260 × 860) (100 用于训练 and 250 用于测试)

提供文本区域坐标以及其文本相应的字符

用途: 文本感知

3000包含文本的室内室外场景图片

包含韩文,英文,数字及其三者混合

用途: 文本感知,识别,分割

74000张从自然场景提取出来的包含字符(0-9, a-z, A-Z)的图片, 包含通过对称生成的字符图片,每张图只包含少量字符

包含62个字符的小尺寸图片 (0-9, a-z, A-Z)

用途: 文本识别

ICDAR 基准数据集

数据集 描述 相应论文
ICDAR 2017 总共63686张图173589标记 论文 link
ICDAR 2015 1000张训练图片和500测试图片 论文 link
ICDAR 2013 229张训练图片和233张测试图片 论文 link
ICDAR 2011 229张训练图片和255张测试图片 论文 link
ICDAR 2005 1001张训练图片和489张测试图片 论文 link
ICDAR 2003 181张训练图片和251张测试图片(包含词以及字符层级标记) 论文 link

3. 竞赛

4. 在线识别服务

名称 描述
Tesseract OCR 有API,免费
Online OCR 有API,免费
Free OCR 有API,免费
New OCR 有API,免费
ABBYY FineReader Online 无API,收费
在线超级转换工具 无API,免费
在线中文识别 有API,免费

5. 相关博客