AI数据标注工具Doccano

Doccano是一款开源的标注工具,用于自然语言处理和机器学习任务。它提供了用户友好的界面,使用户能够轻松地标注文本、序列标注、文本分类和文本配对等任务。doccano支持多种标注格式,并且可以方便地与其他机器学习工具集成。它的简单性和灵活性使得它成为研究人员和开发者的理想选择。下面我们来看下如何使用工具~

Github-doccano

1. 拉取镜像

我们可以通过拉取docker镜像快速完成部署

docker pull doccano/doccano

2. 创建容器

docker container create --name doccano \-e "ADMIN_USERNAME=admin" \-e "ADMIN_EMAIL=admin@example.com" \-e "ADMIN_PASSWORD=password" \-v doccano-db:/data \-p 8090:8000 doccano/doccano

3. 启动容器

docker container start doccano

可以看到后台已经正常运行起来

docker ps

4. 打开页面

http://xx.xx.xx.xx:8090

5. 登录Doccano

使用上文中设置的账号密码就行登录

6. 创建标注任务

7. 导入待标数据

如果没有数据可以下载CLUE Fine-Grain NER的数据集 。这个数据集是在清华大学开源的文本分类数据集THUCTC基础上,选出部分数据进行细粒度命名实体标注,原数据来源于Sina News RSS.下载链接如下👇🏻

样例数据下载

导入json数据

查看待标注数据

8. 创建标签

因为我需要做用户个人信息的识别,所以生成了银行卡身份证QQ号等信息

9.开始标注

滑动文本标注内容,接下来就是漫长的达标工作。

参考:

  1. CLUE Fine-Grain NER
  2. doccano-github

欢迎关注 一起成长

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/67726.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人工智能会率先发现外星生命吗?

重要提示 亲爱的读者朋友,微信又改版啦!如果没有加星标,或者不常读我们的文章,我们的文章就不会在您的“订阅号消息”里大图展示,甚至不被推送,太容易错过了。ಥ_ಥ 请星标Nature Portfolio,常读…

chatgpt赋能python:Python界面的黑色设置

Python界面的黑色设置 Python是一种高级编程语言,广泛应用于各种领域。然而,许多人在使用Python编写代码时,可能会对其默认的白色界面颜色感到厌烦。本文将介绍如何将Python界面设置为黑色,以提高编程体验。 为什么要将Python界…

在latex中使用GB/T 7714—2015参考文献著录规则

毕业论文中的参考文献要求参照《文后参考文献著录规则》(GB/T 7714-2005)的要求书写: http://www.cessp.org.cn/uploads/1/file/public/201607/20160708142456_8mqgu0dpgk.pdf 我直接使用的是 gbt7714 package, GitHub 链接: ht…

Latex-bibliographystyle参考文献风格介绍(按照姓氏排序)

https://jingyan.baidu.com/article/574c52196e12496c8d9dc1c5.html(百度知道) https://www.jianshu.com/p/2e18415cfa72(这里有更详细资料) LaTeX 参考文献标准选项及其样式共有以下8种: plain,按字母的…

Amazon SageMaker简直就是机器学习平台的天花板

一、前言 最近参与了亚马逊云科技【云上探索实验】活动,通过Amazon SageMaker基于Stable Diffusion模型,非常简单快速搭建的第一个AIGC,一开始以为非常复杂,不懂动手操作,但实际上操作非常简单,没有想象中…

smardaten简直是无代码软件开发的天花板

目录 前言 一、smardaten简单介绍 二、基于smardaten创建应用 1、创建一个炫酷的大屏 2、创建一个web端和移动端共存的应用 三、smardaten功能特性和优势 1、操作简单,快速上手 2、圆桌开发,效率倍升 3、图形编排,拖拽生效 4、低无代…

A股市场全景分析系列—指数已企稳,挖掘板块机会

近期,各大指数逐步企稳,震荡中进入到平台位置。这个时候风险释放差不多了,我们可以用全景分析工具观察下后续哪些板块可以布局。 这轮下跌调整从23年1月30日开始算起至今,板块间的涨跌幅度有很大的差别。 概念板块中,比…

群聊!AI时代,人类的终极欲望到底是什么?从《阿凡达2》找到一个答案!

昨天半夜,我在梦里想通了人类的终极欲望。准确点,应该只是终极欲望之一:长生不老!!! 这个答案,是我看了《阿凡达2》电影后得来的。大家有看吗? 有一个情节,人类捕杀图鲲&…

从业余项目到全世界最受欢迎的编程语言之一,Rust 是如何做到的?

【CSDN 编者按】从日常生活中发现电梯软件的系统崩溃,到将一个业余项目发展成为最受开发者喜爱的编程语言,这是全球开发者Graydon Hoare与Rust的一段奇妙故事。 原文链接:https://www.technologyreview.com/2023/02/14/1067869/rust-worlds-f…

4月24日大模型日报合集(持续更新)

熔岩羊驼LLaVA来了:像GPT-4一样可以看图聊天,无需邀请码,在线可玩 链接:https://news.miracleplus.com/share_link/7263 该模型展示出了一些接近多模态 GPT-4 的图文理解能力:相对于 GPT-4 获得了 85.1% 的相对得分。…

Visual Studio Code 和 GitHub Copilot

翻译自 Chris Dias 的博客 AI 这个话题,近期我们看到它被大家广泛地谈论,有些人很兴奋,也有些人表达了担忧。进步几乎每天都在发生,速度前所未有。每天有超过一百万的 Copilot 用户,如果你有机会尝试,你可…

【人工智能】吴恩达来信:LLMs的美好未来

吴恩达来信:LLMs的美好未来 亲爱的朋友们, 大型语言模型 (LLMs) 的竞争格局正在迅速打开。最终赢家尚未出炉,但目前的形势已经令人兴奋。我想分享一些观察结果,重点关注直接面向消费者的聊天接口以及LLMs基础设施和应用程序层。 首先,ChatGPT是一个新的产品类别。它不仅…

ChatGPT为什么会火,如果我用python写一篇毕业论文可以吗?

ChatGPT由于它采用了先进的自然语言处理技术,能够通过学习大量的语言数据而不断提高自己的语言理解和生成能力,使得它在对话方面表现出色。同时,ChatGPT还可以应用于多个领域,例如智能客服、智能助手、机器翻译等,因此…

【爬虫】1.4 POST 方法向网站发送数据

1. 客户端 POST 发送数据 采用 POST 方法访问网站时,客户端向服务器发送表单数据,表单数据的组织方式与 GET 方法的参数列表十分相似,结构如下: "名称1值1&名称2值2……" 多个数据之间用 “&” 符号隔开&#x…

如何快速爬取网页数据(干货)

摘要:对于程序员或开发人员来说,拥有编程能力使得他们构建一个网页数据爬取程序,非常的容易并且有趣。但是对于大多数没有任何编程知识的人来说,最好使用一些网络爬虫软件从指定网页获取特定内容。 网页数据爬取是指从网站上提取特…

服务器数据抓包(原来微信图片真的可以抓包看的)

在我们开发的时候,有时需要抓包,看一下服务器的返回数据,来校验自己请求的参数和返回的参数是否正确。当然,有时候也想抓一下别人的数据看下,比如微信。当然,如果别人的数据加密了,那你就蛋疼了…

倒计时30天!2023世界人工智能大会八大亮点抢先看

2023世界人工智能大会将于7月6-8日在上海举办,以**“智联世界 生成未来”**为主题,聚焦通用人工智能发展,营造良好创新生态,拥抱智能新时代,共话产业新未来。大会将继续发挥“科技风向标、应用展示台、产业加速器、治理…

MANA OASIS加持,毫末算力极致优化,训练成本降低100倍

2023年1月5日,第七届HAOMO AI DAY在北京举办。正值岁末年初,中国自动驾驶届开年盛会精彩来袭。本届AI DAY上,毫末分享了2022年三大战役稳健收官成果,展望2023年全球自动驾驶发展趋势,并发布毫末技术、产品最新成果。 &…

张俊林:由ChatGPT反思大语言模型(LLM)的技术精要(2)

原文:张俊林:由ChatGPT反思大语言模型(LLM)的技术精要(2) 02 学习者:从无尽数据到海量知识 从目前研究结果看,Transformer是足够强大的特征抽取器,尚不需要做特别的改进…

【初探人工智能ChatGPT】2、雏形开始长成

【初探人工智能ChatGPT】2、雏形开始长成 【初探人工智能ChatGPT】2、雏形开始长成安装Flask封装Web接口雏形设置接收参数功能验证聊天写代码代码补全生成图片 写在后面 笔者初次接触人工智能领域,文章中错误的地方还望各位大佬指正! 【初探人工智能Chat…