分享好友 最新资讯首页 最新资讯分类 切换频道
毕业设计 深度学习图像搜索算法-图像搜索引擎(源码分享)
2024-12-29 17:38

今天学长向大家分享一个毕业设计项目

毕业设计 深度学习图像搜索算法-图像搜索引擎(源码分享)

项目运行效果

项目获取

https://gitee.com/assistant-a/project-sharing

图像检索:是从一堆图片中找到与待匹配的图像相似的图片,就是以图找图。 网络时代,随着各种社交网络的兴起,网络中图片,视频数据每天都以惊人的速度增长,逐渐形成强大的图像检索数据库。针对这些具有丰富信息的海量图片,如何有效地从巨大的图像数据库中检索出用户需要的图片,成为信息检索领域研究者感兴趣的一个研究方向。

给定一个包含特定实例(例如特定目标、场景、建筑等)的查询图像,图像检索旨在从数据库图像中找到包含相同实例的图像。但由于不同图像的拍摄视角、光照、或遮挡情况不同,如何设计出能应对这些类内差异的有效且高效的图像检索算法仍是一项研究难题。

图像检索的典型流程 首先,设法从图像中提取一个合适的图像的表示向量。其次,对这些表示向量用欧式距离或余弦距离进行最近邻搜索以找到相似的图像。最后,可以使用一些后处理技术对检索结果进行微调。可以看出,决定一个图像检索算法性能的关键在于提取的图像表示的好坏。

无监督图像检索旨在不借助其他监督信息,只利用ImageNet预训练模型作为固定的特征提取器来提取图像表示。

直觉思路 由于深度全连接特征提供了对图像内容高层级的描述,且是“天然”的向量形式,一个直觉的思路是直接提取深度全连接特征作为图像的表示向量。但是,由于全连接特征旨在进行图像分类,缺乏对图像细节的描述,该思路的检索准确率一般。

利用深度卷积特征 由于深度卷积特征具有更好的细节信息,并且可以处理任意大小的图像输入,目前的主流方法是提取深度卷积特征,并通过加权全局求和汇合(sum-pooling)得到图像的表示向量。其中,权重体现了不同位置特征的重要性,可以有空间方向权重和通道方向权重两种形式。

CroW 深度卷积特征是一个分布式的表示。虽然一个神经元的响应值对判断对应区域是否包含目标用处不大,但如果多个神经元同时有很大的响应值,那么该区域很有可能包含该目标。因此,CroW把特征图沿通道方向相加,得到一张二维聚合图,并将其归一化并根号规范化的结果作为空间权重。CroW的通道权重根据特征图的稀疏性定义,其类似于自然语言处理中TF-IDF特征中的IDF特征,用于提升不常出现但具有判别能力的特征。

Class weighted features 该方法试图结合网络的类别预测信息来使空间权重更具判别能力。具体来说,其利用CAM来获取预训练网络中对应各类别的最具代表性区域的语义信息,进而将归一化的CAM结果作为空间权重。

PWA PWA发现,深度卷积特征的不同通道对应于目标不同部位的响应。因此,PWA选取一系列有判别能力的特征图,将其归一化之后的结果作为空间权重进行汇合,并将其结果级联起来作为最终图像表示。

有监督图像检索首先将ImageNet预训练模型在一个额外的训练数据集上进行微调,之后再从这个微调过的模型中提取图像表示。为了取得更好的效果,用于微调的训练数据集通常和要用于检索的数据集比较相似。此外,可以用候选区域网络提取图像中可能包含目标的前景区域。

孪生网络(siamese network) 和人脸识别的思路类似,使用二元或三元(+±)输入,训练模型使相似样本之间的距离尽可能小,而不相似样本之间的距离尽可能大。

图像检索技术主要包含几个步骤,分别为

  • 输入图片

  • 特征提取

  • 度量学习

  • 重排序

  • 特征提取:即将图片数据进行降维,提取数据的判别性信息,一般将一张图片降维为一个向量

  • 度量学习:一般利用度量函数,计算图片特征之间的距离,作为loss,训练特征提取网络,使得相似图片提取的特征相似,不同类的图片提取的特征差异性较大。

  • 重排序:利用数据间的流形关系,对度量结果进行重新排序,从而得到更好的检索结果。

学长在这做了个图像检索器的demo,效果如下

关键代码

 
 

项目获取

最新文章
AI绘画修仙师尊仙气
随着人工智能技术的不断发展,AI绘画修仙师尊仙气这个行业逐渐兴起,引起了广大修仙爱好者的关注。什么是AI绘画修仙师尊仙气呢?
Android OpenCV基础(一、OpenCV入门)
模块说明core该模块包含 OpenCV 库的基础结构以及基本操作。improc图像处理模块包含基本的图像转换,包括滤波以及类似的卷
ai智能拓客系统-鹰眼智客
鹰眼智客ai智能拓客系统是鹰眼团队自主研发的一套营销系统,基于阿里云服务器可实现软件的持久更新和系统的后期稳定运行;系统内
AI绘画:瞬间创造惊人的虚拟人物形象
你是否曾经想过,如果你可以创造出独一无二的虚拟人物形象,那么这将是一种怎样的体验?想象一下,你可以通过简单的几个步骤,就
google三件套一键安装谷歌框架最新版
google三件套一键安装谷歌框架最新版是一款必备的手机框架软件,适用于使用谷歌服务的手机。该软件原名为Go安装器,包含谷歌服务
### 智能文案生成器:一键解决文章创作、编辑与优化全方位需求
在数字时代内容创作已成为信息传播的核心力量无论是企业传、个人博客还是社交媒体高优劣的内容都是吸引和留住使用者的关键。传统
coze字节官网,国际版扣子网站,字节跳动的AI工具,基于GPT4模型
coze字节官网,国际版扣子网站,字节跳动的AI工具,基于GPT4模型Coze 是新一代一站式 AI Bot 开发平台。无论你是否有编程基础,都可
Centos7.9 安装WordPress(LAMP)
------ 安装方式参考SEO禅的安装方式WorePress安装环境 可以到wordpress官网,了解当前最新wordpress源码包6.1.1所需要的
2023年度六大政法舆情效应解析
编者按:日常发生的诸多网络事件中,引发的舆情反馈不尽相同,这些舆情反馈虽是网民行为习惯以及传播机制的具象化表征,但也存在一定
200个C语言单词,请收藏!
coding the program编程simplfy单-化,简单化programming程序revisionn校订,修正programmer程序员occupyw占领,住进1ogic逻辑,