🐳 NLP 标注工具 doccano 安装简版教程 🐳
1、本地环境配置
VMware 16.1.0 + Ubuntu 18.0 + doccano(一般取最新版本)。其中 doccano 官方 Github 为 doccano-Github 。
2、VMware 和 Ubuntu 相关安装
VMware 16 中安装 Ubuntu 18 参考教程 。
- 如果遇到 VMware Tools 的问题(如图 1 所示),比如无法从本地拖入 VMware,此时更新 VMware 至最新版即可,参考链接 。
- 另外,如果无法打开安装的 Ubuntu,可以参考链接 。
- 经测试,使用解决办法三的第五步(如图 2 所示,禁用 + 启动) + 重启也可以解决无法打开 Ubuntu 的问题。
3、doccano 安装参考一
参考配置流程,详细版 。
- 其中所有 pip 命令需要修改为 pip3 命令(Ubuntu 18.0 默认 python3),否则可能出现某些包安装 error,如 Django==2.2.13 等。
- 遇到的 error 一般 Baidu + Google 可解。
4、doccano 安装参考二
主要错误为:执行 sudo npm install npm -g 时报 fsevents warning,以及安装报错等,按如下步骤处理。
- 替换源 npm config set registry https://registry.npm.taobao.org 。
- 替换源 npm config set registry http://registry.npmjs.org 。
- 替换源 npm config set registry http://registry.npmjs.eu 。
- 在以上三个源多次替换下更新 npm(sudo npm i npm -g) 和 nodejs(npm install –g n)。
- 更新稳定版本的 nodejs(n stable,不用 n latest)。
- 更新完需要 source ~/.profile。
- 如果以上操作后再无 warning,说明 MacOS 下配置成功 😭,参考链接 。
- 但是走完以上流程,依旧报 warning,server 无法 run,说明 fsevents 确实在 Windows/Ubuntu 上出现了问题 😷。此时,放弃这个尽管详细但依旧无法走通的配置方案 😔。
5、doccano 安装参考三
返回 doccano 官方 Github,按 pip installation 所提供步骤重新开始。
- pip3 install doccano(我的配置环境中用 pip 安装后面会报错),我在 root 下安装(sudo su -)成功。
- doccano 命令打开本地 server,参数如图 3 所示,默认 username/password 为 admin/password。
- 登陆后如图 4 所示,如果默认 Firefox 无法 start annotation,安装 Chrome 打开即可。
6、doccano 安装参考四
Windows 7 安装过程同上,区别在于 Ubuntu 本地登陆为 http://0.0.0.0:8000/ ,Windows 本地登录为 http://127.0.0.1:8000/ 。
- 其中遇到一个 json 相关的问题“SQLite does not support JSONFields”,可参考 解决方案 和 SQLite 下载链接 。
7、doccano 安装参考五
doccano 使用教程可参考官方文档 doccano-Github 以及作者团队的 知乎介绍 等。