IndicASR

Speech Recognition for Indian Languages

Notes

IndicASR is built on top of and and has pre-trained models for Telugu in the current release.
The Telugu model is trained on the train set of MSR Indic corpus + a private corpus of ~94 hours obtained from various telugu interview playlists from Youtube.

Use as python module

pip install --upgrade indicasr

from indicasr import IndicASR
asr = IndicASR("telugu")
# Run one file at once
asr.transcribe("samples/telugu/hari.16k.wav")
# "ఈ సినిమా తర్వాత నిర్మాతలు రూటు మార్చే ఆలోచనలో ఉన్నారు"

# Batch inference
asr.transcribe(["samples/telugu/hari.16k.wav",
              "samples/telugu/ramana.16k.wav"])
# ["ఈ సినిమా తర్వాత నిర్మాతలు రూటు మార్చే ఆలోచనలో ఉన్నారు",
# "భారత దేశము నా మాత్ర భూమి భారతీవులంతా నా సోదరి సోదరులు"]

sample name	prediction	expected
telugu/hari.16k.wav	ఈ సినిమా తర్వాత నిర్మాతలు రూటు మార్చే ఆలోచనలో ఉన్నారు	ఈ సినిమా తర్వాత నిర్మాతలు రూటు మార్చే ఆలోచనలో ఉన్నారు
telugu/harsha.16k.wav	నేను ఇప్పుడు గడ్డి కొడుతున్నారు	నేను ఇప్పుడు గడ్డి కొడుతున్నాను
telugu/indra.16k.wav	నేను భారత దేశంలో ఉన్నాను	నేను భారత దేశంలో ఉన్నాను
telugu/praneeth.16k.wav	నా పేరు ప్రణి బేదపూడి	నా పేరు ప్రణీత్ బేదపూడి
telugu/ramana.16k.wav	భారత దేశము నా మాత్ర భూమి భారతీవులంతా నా సోదరి సోదరులు	భారత దేశము నా మాతృ భూమి భారతీయులంతా నా సోదరీ సోదరులు
telugu/sai_krishna.16k.wav	నా పేరు సాయి కృష్ణ	నా పేరు సాయి కృష్ణ

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
indicasr		indicasr
samples/telugu		samples/telugu
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IndicASR

Notes

Use as python module

About

Releases 1

Packages

Languages

License

notAI-tech/IndicASR

Folders and files

Latest commit

History

Repository files navigation

IndicASR

Notes

Use as python module

About

Topics

Resources

License

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages