Skip to content

将文本文件内容,转为一整段MP3,理论可同时配置多个账号。

License

Notifications You must be signed in to change notification settings

e790a8/Baidu_Speech_Threading

Repository files navigation

简单百度语音识别


项目简介

提供一个简单的文本转音频、音频转文本、视频转音频、视频转文本接口,可同时使用多个账号进行识别,提高效率。
感觉还可以的给个star,谢谢了!

配置说明

本项目使用百度智能云的语音识别API
使用前,请使用百度账号登录百度智能云
创建应用,添加语音识别功能
image-20200517135924671
得到AppID、API Key、Secret Key即可

依赖安装

pip install -r requirements.txt

方法说明

  • 创建实例

    Baidu_speech(App_ID:str,API_Key:str,Sercret_Key:str)
    
    App_ID : 应用App_ID
    API_Key : 应用API_Key
    Sercret_Key : 应用Sercret_Key
  • 文本转音频

    get_Text_to_Mp3(File_path:str,File_save_path = None,is_Open_Threading = False,Option = None)
    
    File_path : txt文件路径名称
    File_save_path : MP3文件保存路径与名称默认与txt文件同目录同名称
    is_Open_Threading : 是否开启多线程默认不开启
    Option : 生成音频配置参数默认{'spd':5,'pit':5,'vol':5,'per':0}
          范围 : {'spd':0-9,'pit':0-9,'vol':0-15,'per':0-5}
          'spd' : 语速取值 0-5
          'pit' : 音调取值 0-5
          'vol' : 音量取值 0-15
          'per' : 发音人0为女声默认)、1为男声3为情感男4为情感女   
  • 获取未成功的文本集合

    getErrorList()
  • 视频转音频

    get_Video_to_Audio(File_path : str,File_save_path : str = None,format : str = None)
      
    File_path : 视频文件路径名称支持视频格式为MP4FLVWEBM
    File_save_path : 音频保存路径默认与视频文件同目录同名称
    format : 音频格式默认MP3可指定为MP3WAV
  • 视频转文本

    get_Video_to_Text(File_path : str,File_save_path : str = None,is_Open_Threading : bool = False,Option : dict = None)
    
    File_path : 视频文件路径名称支持视频格式为MP4FLVWEBM
    File_save_path :文本保存路径默认与视频文件同目录同名称
    is_Open_Threading : 是否开启多线程默认不开启
    Option : 视频属性配置参数默认{'dev_pid':1537}
        普通话(纯中文识别) : {'dev_pid':1537}
        英语 : {'dev_pid':1737}
        粤语 : {'dev_pid':1637}
        四川话 : {'dev_pid':1837}
        普通话远场 : {'dev_pid':1936}
  • 音频转文本

    get_Audio_to_Text(File_path : str,File_save_path : str = None,is_Open_Threading : bool = False,Option : dict = None)
    
    File_path : 音频路径支持音频格式为MP3WAV
    File_save_path : 文本保存路径默认与音频路径同目录同名称
    is_Open_Threading : 是否开启多线程默认不开启
    Option : 音频属性配置参数默认{'dev_pid':1537}
        普通话(纯中文识别) : {'dev_pid':1537}
        英语 : {'dev_pid':1737}
        粤语 : {'dev_pid':1637}
        四川话 : {'dev_pid':1837}
        普通话远场 : {'dev_pid':1936}

示例代码

import baidu_speech

App_ID = "" # 17xxxx0x
API_Key = ""    # xxxxv8lbtxxxxNQG4lhxxxx
Secret_Key = "" # xxxxDclQ4pUwxxxxQXHGcVISoxxxxxDx
test = baidu_speech.Baidu_speech(App_ID,API_Key,Secret_Key)
# test.getMp3("test.txt")
test.get_Text_to_Mp3("test.txt",is_Open_Threading=True)
# test.getMp3("test.txt","test.mp3",False,{"spd":5,"pit":5,"vol":5,"per":0})

效果展示

image-20200517135924672

About

将文本文件内容,转为一整段MP3,理论可同时配置多个账号。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages