以图搜图
随着数字时代的到来,单单的文字搜素已经无法满足人们的搜索了,图像搜索,甚至是视频搜索都已经比较成熟。本文大致讲解下图像搜索:
发展历程
原理
搜索项目:主要分为三个部分——图像特征抽取,构建搜素库,构建索引。
- 第一步:就是选取好合适的图像特征抽取方法,传统的方法有各种图像处理的方法,比如hog直方图,小波过滤等方法提取特征,现有比较热门的深度学习方法,比如卷积神经网络等;根据实际情况进行合理选择,一般而言建议使用卷积神经网络方法,但复杂的系统都会结合二者一起使用,比如淘宝的拍立淘等。
- 第二步:使用特征抽取器对图像库抽取特征,并以向量的形式存储起来;
- 第三步:构建索引,索引的好坏影响搜索速度,常用的有哈希编码等;
过程
给定一张图像,首先经过主体检测等,或者全图抽取特征;之后与图像库中的图像特征进行特征匹配,一般计算余弦相似度指标,余弦相似度可以用来衡量两个向量的相似度,关于这方面的具体介绍可以看博主的另外一篇关于余弦相似度的介绍。最后按照相似度的大小进行排序,输出匹配结果即可。
注意事项:
- 是否进行主体检测
- 搜索时候是否有比较快速的方法,比如knn
- 其他的优化手段
结果
红色方框是查询图,绿色方框是完全匹配的结果,其它是最相似的top。