文章汉化系列目录
文章目录
- 文章汉化系列目录
- 摘要
- 引言
- 1、
- 2、
- 3、
- 三、
- 1、
- 2、
- 3、
- 四、
- 1、
- 2、
- 3、
- 五、
- 1、
- 2、
- 3、
- 六、
- 1、
- 2、
- 3、
- 七、
- 1、
- 2、
- 3、
- 八、
- 1、
- 2、
- 3、
摘要
自动生成描述图像的句子一直是计算机视觉和自然语言处理领域的长期挑战。随着物体检测、属性分类、动作识别等方面的进展,学术界对该领域的兴趣重新高涨。然而,评估生成描述的质量仍然是一个难题。我们提出了一种新的基于人类共识的图像描述评估范式。该范式包括三个主要部分:一种基于三元组的新方法,用于收集人类标注来衡量共识;一种新的自动化评价指标CIDEr,用于捕捉共识;以及两个新数据集PASCAL-50S和ABSTRACT-50S,每个图像包含50条描述句子。我们的简单指标在捕捉人类共识判断方面,比现有的评价指标在各种来源生成的句子上表现更好。我们还使用该新评估协议对五种最先进的图像描述方法进行了评估,并提供了一个基准,以便未来对比。此外,CIDEr的一个版本CIDErD已在MS COCO评估服务器上发布,以支持系统性的评估和基准测试。