Label Studio 介绍
文章目录
- Label Studio 介绍
- 前言
- 一、安装介绍
- 二、Run with Docker Compose
- 1、WSL2安装
- 2、Docker Desktop安装
- 3、Label Studio安装(第二种方法 Run with Docker Compose )
- 三、Install for local development
- 1.下载源码
- 2.安装poetry
- 3.安装依赖
- 4.调试和修改源码
- 总结
前言
Label Studio是一个开源的功能强大的标注平台,可以标注视频,图片,音频,文字等各类型的数据。
这篇文章主要介绍Label Studio的两种安装方式。
下面是开源地址
Github地址
一、安装介绍
环境:Windows 11
Label Studio有许多安装方式,我主要测试了
下面的第二种 Run with Docker Compose 和 第五种 Install for local development
第二种方法
使用PostgreSQL作为数据库,它是一种生产就绪型数据库,取代local安装时性能较低的 SQLite3。更适用于生产环境
第五种方法
可以在本地调试修改源码,不用从Pypi安装软件包,比较适用于本地开发
Install locally with Docker
Run with Docker Compose (Label Studio + Nginx + PostgreSQL)
Install locally with pip
Install locally with Anaconda
Install for local development
Deploy in a cloud instance
二、Run with Docker Compose
因为系统是Windows,要安装Docker必须先装WLS2
1、WSL2安装
管理员身份打开 PowerShell,运行以下命令,安装wsl
wsl --install
安装完成后重启
重启后,管理员身份打开 PowerShell,运行以下命令,更新并将 WSL 2 设置为默认版本
wsl --update
wsl --set-default-version 2
安装 Ubuntu 22.04.5 LTS
打开微软商店,搜索Ubuntu,找到Ubuntu 22.04.5 LTS,点击Get
安装完成后,点击打开按钮,设置用户名和密码
下一步,配置一下加速地址,不然国内下载一些包时会很慢
#备份
sudo cp /etc/apt/sources.list /etc/apt/sources.list.back
#编辑
sudo vim /etc/apt/sources.list
编辑如下
deb https://mirrors.aliyun.com/ubuntu-ports/ bionic main restricted universe multiverse
deb-src https://mirrors.aliyun.com/ubuntu-ports/ bionic main restricted universe multiversedeb https://mirrors.aliyun.com/ubuntu-ports/ bionic-security main restricted universe multiverse
deb-src https://mirrors.aliyun.com/ubuntu-ports/ bionic-security main restricted universe multiversedeb https://mirrors.aliyun.com/ubuntu-ports/ bionic-updates main restricted universe multiverse
deb-src https://mirrors.aliyun.com/ubuntu-ports/ bionic-updates main restricted universe multiversedeb https://mirrors.aliyun.com/ubuntu-ports/ bionic-backports main restricted universe multiverse
deb-src https://mirrors.aliyun.com/ubuntu-ports/ bionic-backports main restricted universe multiverse
2、Docker Desktop安装
下载地址
下载后得到
双击安装,一路点默认,安装完成后会要求重启。
重启后配置一下Docker,点击右上角的齿轮图标进入设置
配置一下阿里云镜像加速,可参考:https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors 进行配置
Docker Desktop 中原先的配置
配置后
Docker daemon 配置文件
{"builder": {"gc": {"defaultKeepStorage": "20GB","enabled": true}},"experimental": false,"registry-mirrors": ["https://s1fq5njf.mirror.aliyuncs.com","https://hub-mirror.c.163.com/","https://registry.docker-cn.com","https://docker.m.daocloud.io","https://dockerproxy.com","https://mirror.baidubce.com","https://docker.nju.edu.cn","https://mirror.iscas.ac.cn","https://huecker.io","https://dockerhub.timeweb.cloud","https://noohub.ru"]
}
3、Label Studio安装(第二种方法 Run with Docker Compose )
克隆代码并安装,这个过程大概需要5-10分钟
下载代码
#代码有点大,使用这种方法,只克隆最近一次commit,下载的快而且不容易崩溃
git clone --depth 1 https://gitclone.com/github.com/HumanSignal/label-studio.git label-studio
cd label-studio
#将浅克隆转换为完整克隆
git fetch --unshallow
使用Docker compse安装Label Studio
docker compose -f docker-compose.yml up -d
显示如下
此时可以查看Docker Desktop查看镜像和容器
查看一下它的数据库
此时打开http://localhost:8080 可以看到下面的界面,说明安装成功,可以注册账户进行使用
三、Install for local development
环境 Windows 11,这种方式安装不必安装Docker,WSL2,数据库是默认的SQLite3,可以作为开发测试使用
1.下载源码
# 为了和上面我下载的源码做区分,我把文件夹命名为了label-studio-master
git clone --depth 1 https://gitclone.com/github.com/HumanSignal/label-studio.git label-studio-master
cd label-studio-master
# 将浅克隆转换为完整克隆
git fetch --unshallow
2.安装poetry
打开Windows Powershell
cd C:\Code\OpenSource\label-studio-master
# 安装poetry 需要10多分钟
pip install poetry
# 查看poetry 的配置
poetry config --list
运行情况
查看配置
修改virtualenvs.in-project = false,使用指令:
poetry config virtualenvs.in-project true
修改后
3.安装依赖
# 创建虚拟环境
poetry shell
# 安装依赖 需要10多分钟
poetry install
# Run database migrations
python label_studio/manage.py migrate
python label_studio/manage.py collectstatic
# Start the server in development mode at http://localhost:8080
python label_studio/manage.py runserver
运行情况
现在打开 http://localhost:8080 就可以使用了
4.调试和修改源码
如果我们需要调整一些配置或修改源码,可以用VSCode打开代码,修改代码,加一些断点,然后运行找到label_studio/manage.py文件,点击调试就可以了
比如 我做了如下更改
1.我修改了base.py文件的一些配置
2.修改io.py文件,把app的名称从label-studio改成了label-studio-master
3.添加了一个自定义的标注模板
模板文件地址
模板文件地址
修改源码的配置文件后,需要重新运行下面三个命令
python label_studio/manage.py migrate
python label_studio/manage.py collectstatic
python label_studio/manage.py runserver
总结
本文简单介绍了两种Label Studio的安装方法。 Run with Docker Compose 和 Install for local development
Docker Compose安装,使用PostgreSQL作为数据库,它是一种生产就绪型数据库,取代local安装时性能较低的 SQLite3。更适用于生产环境
local development,可以在本地调试修改源码,不用从Pypi安装软件包,比较适用于本地开发
下面一篇介绍标注人员如何使用Label Studio进行标注
使用 Label Studio 标注文本