这个项目需要安装 Python3 和以下的 Python 函数库:
- Pandas
- NumPy:数值计算
- matplotlib: 用于画图
- nltk: 用于处理单词文本
- scikit-learn: 用于模型训练和分析
- jupyter,notebook: 实验基本环境,以运行和编辑
.ipynb
pip install pandas numpy matplotlib nltk scikit-learn jupyter notebook
python -c "import nltk; nltk.download('wordnet')"
优达学城推荐学生安装 Anaconda,这是一个常用的 Python 集成编译环境,且已包含了本项目中所需的全部函数库(除nltk
外)。
代码的模版已经在 PredictYourCuisine.ipynb
文件中给出。你还会用到菜系数据集来完成这个项目。我们已经为你提供了一部分代码,但还有些功能需要你来实现才能以完成这个项目。
在终端或命令行窗口中,选定 MLND-cn-trial/
的目录下(包含此README文件),运行下方的命令:
jupyter notebook PredictYourCuisine.ipynb
这样就能够启动 Jupyter notebook 软件,并在你的浏览器中打开文件。
此项目的数据集来自Kaggle What's Cooking 竞赛。共 39774/9944 个训练和测试数据点,涵盖了中国菜、越南菜、法国菜等的信息。
特征
id
: 数据编号,例如, "24717".ingredients
: 此菜所包含的原料,例如["tumeric", "vegetable stock", ...]
目标变量
cuisine
: 菜名,例如,"indian".
This repository is deprecated; therefore, we are going to archive it. However, learners will be able to fork it to their personal Github account but cannot submit PRs to this repository. If you have any issues or suggestions to make, feel free to:
- Utilize the https://knowledge.udacity.com/ forum to seek help on content-specific issues.
- Submit a support ticket along with the link to your forked repository if (learners are) blocked for other reasons. Here are the links for the retail consumers and enterprise learners.