PythonOCR-FlaskWebProject

PDF dosyaları içindeki yazıların string olarak elde edilmesini sağlar. Api uygulaması olarak geliştirilmiştir. Diğer tüm platformlardan istek yaparak pdf dosyalardan metin çıkartılıp alınabilir.

Pytesseract : “TesseractNotFound Error: tesseract is not installed or it's not in your path”,hatası alırsanız yapmanız gerekenler

Windows için Kurulum

1

Bilgisayarınızda Tesseract OCR kurulu olmalıdır. Links Uygun sürümü buradan indirin.

2

Tesseract yolunu Sistem değişkenlerine ekleyin nasıl ekleneceğini bilmiyorsanız bu videoyu izleyin Links

3

pip install pytesseract pip install tesseract pip install pdf2image pip install flask_sqlalchemy pip install flask_httpauth pip install passlib

komutlarını çalıştırın

4

Bu satırı kodlarınıza ekleyin (proje içersinde eklidir.)

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

4

Bu satırı kodlarınıza ekleyin (proje içersinde eklidir.)

TESSDATA_PREFIX = 'C:/Program Files (x86)/Tesseract-OCR'

sizin kurduğunuz dizin neresi ise o dizini r ' ' arasına eklemelisiniz.

5 -

Kodu tekrar çalıştırın.>

Not: out_text.txt dosyasında pdf dosyasının içeriğini göreceksiniz. Eğer Türkçe karakter sorunu var ise karakter kodlamasını UTF-8 yapmalısınız.

Python SQLAlchemy Kurulumu

pip install SQLAlchemy==1.3.11

#Muhtemel Hatalar TypeError: can only concatenate str (not "PDFPageCountError") to str ya da TypeError: can only concatenate str (not "PDFInfoNotInstalledError") to str hatalarını alırsanız verdiğiniz pdf in yolunun doğru olduğuna emin olunuz. Doğru olsa bile windowsta o klasöre erişimde yetki problemi olabilir.

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
PythonOcr_FlaskWebProject		PythonOcr_FlaskWebProject
.gitattributes		.gitattributes
.gitignore		.gitignore
PythonOcr_FlaskWebProject.sln		PythonOcr_FlaskWebProject.sln
README.md		README.md
d.pdf		d.pdf
d2.pdf		d2.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PythonOCR-FlaskWebProject

PDF dosyaları içindeki yazıların string olarak elde edilmesini sağlar. Api uygulaması olarak geliştirilmiştir. Diğer tüm platformlardan istek yaparak pdf dosyalardan metin çıkartılıp alınabilir.

Windows için Kurulum

1

2

3

4

4

5 -

Not: out_text.txt dosyasında pdf dosyasının içeriğini göreceksiniz. Eğer Türkçe karakter sorunu var ise karakter kodlamasını UTF-8 yapmalısınız.

Python SQLAlchemy Kurulumu

About

Releases

Packages

Contributors 2

Languages

mustafaerdogmus/PythonOCR-FlaskWebProject

Folders and files

Latest commit

History

Repository files navigation

PythonOCR-FlaskWebProject

PDF dosyaları içindeki yazıların string olarak elde edilmesini sağlar. Api uygulaması olarak geliştirilmiştir. Diğer tüm platformlardan istek yaparak pdf dosyalardan metin çıkartılıp alınabilir.

Windows için Kurulum

1

2

3

4

4

5 -

Not: out_text.txt dosyasında pdf dosyasının içeriğini göreceksiniz. Eğer Türkçe karakter sorunu var ise karakter kodlamasını UTF-8 yapmalısınız.

Python SQLAlchemy Kurulumu

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages