Skip to content

Latest commit

 

History

History
314 lines (202 loc) · 10.2 KB

README.md

File metadata and controls

314 lines (202 loc) · 10.2 KB

基于RASA的中文任务型机器人

Static Badge Static Badge Static Badge

Static Badge Static Badge Static Badge

Static Badge

Static Badge Static Badge Static Badge

2022/6/8 后 rasa-x 不再免费 直接安装 rasa 即可


💡 文件说明 💡

文件 描述
actions 自定义动作服务器
components 自定义组件
data/nlu Rasa NLU 的训练数据
data/rules Rasa 规则数据
data/stories Rasa 故事数据
data/keywords 自定义组件:关键词的配置文档 keywords.yml
domain 领域指定了 rasa 应该知道的意图、实体、插槽、响应、表单和动作。它还定义了会话会话的配置。
models 训练的模型数据
pipeline 流水线组件配置
server 前后端服务
source RASA 源代码,只是用来调试 DIET 的*(:з」∠)*
document langchain 学习的知识库
config.yml 相关配置

💡 目前的功能 💡

功能 描述 API 来源 数据来源 说明
关键词 检测到关键词进行回复 - -
闲聊 简易打招呼 - -
任务型 查询天气 心知天气 - -
任务型 查询快递 快递网 - -
任务型 查询车票 12306 smp2019 -
任务型 查询新闻 聚合 - -
任务型 微博热搜 天行 - -
任务型 今日头条 天行 - -
任务型 查询汇率 聚合 - -
任务型 食物营养 天行 - -
未知意图处理 未知意图处理 langchain langchain -

💡 基本使用 💡

依赖安装

pip install -r requirements.txt (python3.10) pip install -r requirements.py38.txt (python3.8)

langchain 依赖 nltk

NLTK

训练

rasa train --domain domain

多线程训练

rasa train --domain domain --num-threads 12

开启 action 服务器

rasa run actions

使用

rasa shell


💡 其他命令 💡

查看模型从文本中提取的意图和实体

rasa shell nlu

交互式对话

rasa interactive --domain domain

rasa interactive --domain domain --model <指定模型>

故事可视化

rasa visulize

验证数据

rasa data validate

拆分 nlu 数据

rasa data split nlu

测试数据集

rasa test nlu --nlu train_test_split/test_data.yml

交叉验证测试数据集

rasa test nlu --nlu data/nlu.yml --cross-validation

对比 nlu 管道

rasa test nlu --nlu data/nlu.yml --config config_1.yml config_2.yml

开启 api 服务器

rasa run --enable-api --cors "*" --debug

查看 DIET 训练日志

tensorboard --logdir ./log

微调 (实验性功能)

rasa train --finetune --domain domain

微调模型时通常需要比从头开始训练时更少的迭代次数(epochs)。你可以使用一个配置了更少迭代次数的模型配置,或者使用 --epoch-fraction 标志。例如,如果 DIETClassifier 配置为使用 100 个迭代,指定 --epoch-fraction 0.5 会只用 50 个迭代来微调。

rasa train --finetune --domain domain --epoch-fraction 0.5

  • 用于微调的配置应与原始训练模型时使用的配置完全相同。唯一可以更改的参数是各个机器学习组件和策略的迭代次数(epochs)。
  • 基础模型训练的标签集(包括意图、动作、实体和插槽)应与微调时使用的训练数据中的标签完全相同。这意味着在增量训练期间,你不能在训练数据中添加新的意图、动作、实体或插槽标签。但你仍然可以为现有的每个标签添加新的训练样本。如果在训练数据中添加/删除了标签,则需要从头开始训练。
  • 微调的模型应当与当前安装的 rasa 版本的 MINIMUM_COMPATIBLE_VERSION 相匹配。

💡 简单前端页面 💡

python server/start_services.py

功能多一点的:rasa 简易前端


💡 更新 💡

2024/10/24 删除了知识图谱相关代码


💡 推荐使用 python 虚拟环境进行管理 💡

Static Badge

创建 python 虚拟环境

conda create -n rasa python=3.10

激活虚拟环境

conda activate rasa

使用.venv

python -m venv .venv

.venv\Scripts\activate

.venv\Scripts\python -m rasa


📚 问题 📚

  • 有些依赖库需要 Microsoft Visual C++ 14.0 以上的环境 可在 visual studio 中进行安装 ,或使用 Microsoft C++ Build Tools Static Badge

  • 安装速渡过慢

pip install -i https://pypi.douban.com/simple module # 使用豆瓣源
pip install -i http://mirrors.aliyun.com/pypi/simple/ module # 阿里云
pip install -i https://pypi.mirrors.ustc.edu.cn/simple/ module # 中国科技大
pip install -i http://pypi.douban.com/simple/ module # 豆瓣(douban)
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ module # 清华大学
pip install -i http://pypi.mirrors.ustc.edu.cn/simple/ module # 中国科学技术大学
git config --global --add remote.origin.proxy ""
git config --global http.sslBackend "openssl"
  • ERROR:pip install xmlsec 安装失败
 × Building wheel for xmlsec (pyproject.toml) did not run successfully.
 │ exit code: 1
 ╰─> [13 lines of output]
     running bdist_wheel
     running build
     running build_py
     creating build
     creating build/lib.linux-x86_64-cpython-38
     creating build/lib.linux-x86_64-cpython-38/xmlsec
     copying src/xmlsec/py.typed -> build/lib.linux-x86_64-cpython-38/xmlsec
     copying src/xmlsec/constants.pyi -> build/lib.linux-x86_64-cpython-38/xmlsec
     copying src/xmlsec/tree.pyi -> build/lib.linux-x86_64-cpython-38/xmlsec
     copying src/xmlsec/template.pyi -> build/lib.linux-x86_64-cpython-38/xmlsec
     copying src/xmlsec/__init__.pyi -> build/lib.linux-x86_64-cpython-38/xmlsec
     running build_ext
     error: xmlsec1 is not installed or not in path.
     [end of output]
    note: This error originates from a subprocess, and is likely not a problem with pip.
    ERROR: Failed building wheel for xmlsec

安装依赖库:

apt-get install -y libxml2-dev libxmlsec1-dev libxmlsec1-openssl

💡 Docker 💡

Dockerfire 参考:

FROM python:3.8.15
WORKDIR /rasa
COPY . /rasa
RUN apt-get update && \
    apt-get install -y libxml2-dev libxmlsec1-dev libxmlsec1-openssl && \
    apt-get clean && \
    rm -rf /var/lib/apt/lists/*
RUN python -m pip install --upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple/ && \
    pip install \
    xmlsec==1.3.13 \
    tensorflow==2.12.0 \
    scikit_learn==1.1.3 \
    matplotlib==3.5.3 \
    protobuf==3.20.3 \
    -i http://mirrors.aliyun.com/pypi/simple/  --trusted-host mirrors.aliyun.com && \
    pip install -r requirements.txt -i http://mirrors.aliyun.com/pypi/simple/  --trusted-host mirrors.aliyun.com

本仓库 docker 下载

docker push lyirs/rasa:1.0
docker run -it lyirs/rasa