Video AI assistant, voice to text, text AI summary 使用公告请仔细阅读后使用:
一,打包好的应用有2个必要条件。 1,科学上网 2,需要2个API,一个百度大模型的免费128k的,一个是whisper3的API
开源的本地可以运行,下载whisper模型,然后配置AI的key,
二,参数配置:
1,baidu_api_key : 目前只支持百度大模型,调用得是免费的是128K接口,key和密钥自己申请,可以自己改本地模型也可调用其他模型。
2,server_ip: 这里是解析douyin链接服务器的地址。port: 地址的端口,这里也可以源码自己改,爬虫的API
3,以下参数建议默认即可:
"count": 5, 爬取的数量,如果你要爬取所有视频或者所有MP3,可以设置100。 5-100
"max_workers": 8, 下载的线程
"download_type": "MP3", 下载类型,这个没用懒得改了,默认别动就好。
下面的AI总结的参数,可以适当调整。
"temperature": 0.75,
"top_p": 0.75,
"penalty_score": 1.0,
"max_output_tokens": 4096,
4, text_for_summarization : 这是给百度AI下达指定的参数,你可以让它总结笔记,也可以让他分析数据等等。
5,record_duration : 直播录制时长,默认30秒,如果要长期录制可以填1800秒或者3600秒,录制期间界面会卡住,这是正常的,点击录制后不用管它。
6,user_urls_input : 这里输入douyin的用户首页链接或者直播的链接。
7 ffmpeg_path : ffmpeg的bin路径,不下载youtube的不用搭理,实际没什么用,作者自己有时候下载youtubeMP3用
8 whisperx_api: 语音转文字的API,没有科学上网的语音转文字功能用不了,建议改成本地whisper模型。懂代码的自己改。
9,youtubeURL : 放youtube视频地址的,放入然后点击短视频mp3下载即可,
小白要用的话联系作者,很少写项目所以结构也是一沓糊涂,文件名这些都是瞎取得,最后说说它能做什么吧。
1,批量下载用户视频 2,语音转文字 3,通过AI总结笔记,改写,润写,续写,剧本,等等。 4,直播批量录制,转mo3,转文字,总结等。 后期:1, 整合对话式AI,可以把总结的笔记再次进行人工对AI调整, 2,文生图,文生视频,等等。