迁移学习入门(读王晋东博客)

1.TCA

  映射使两个域边缘分布相近,限制条件为散度(衡量两个数据集的差异程度,最大化差异)

2.JDA

   在TCA基础上加入条件分布相近,此时为联合分布(两个概率分布,并非概率论中的"联合分布"),限制条件也为散度

3.深度神经网络的可迁移性

介绍 NIPS 2014的《How transferable are features in deep neural networks?》
主要是结论性的东西:
   1.神经网络的前3层基本都是general feature,进行迁移的效果会比较好;
   2.深度迁移网络中加入fine-tune(模型微调),效果会提升比较大,可能会比原网络效果还好;
   3.Fine-tune可以比较好地克服数据之间的差异性;
   4.深度迁移网络要比随机初始化权重效果好;
   5.网络层数的迁移可以加速网络的学习和优化。

此篇对原文的理解有些异议的地方:
  (1)AnB 是指对baseA前n层权重锁定,后面8-n层随机初始化后继续在数据B上训练得来,再做分类。
  (2)BnB的性能,一直到B3B貌似都不错,B4B到B5B性能下降严重,作者解释原因之一可能是4层5层与前后的层是联合起来学习特征的,“jointly trained”,将1-4层锁定只让5-8层学习,破坏了所学特征的一个“整体性”。

未考证原文,借鉴于评论区

4.深度迁移网络

DaNN

  DaNN的结构异常简单,它仅由两层神经元组成:特征层和分类器层。
  所以,整个网络的优化目标也相应地由两部分构成:在有label的源域数据上的分类误差,以及对两个领域数据的判别误差。

DDC

  在原有的AlexNet网络的基础上,对网络的fc7层(分类器前一层)后加一层适配层(adaptation layer)。适配层的作用是,单独考察网络对源域和目标域的判别能力。如果这个判别能力很差,那么我们就认为,网络学到的特征不足以将两个领域数据区分开,因而有助于学习到对领域不敏感的特征表示。

DAN

DAN相比DDC加了2点改进:
  一是多适配了几层特征;
  二是采用了之前Arthur Gretton提出的多核MMD替换掉原有的单核MMD。
多核MMD即多核加权形成一个核

5. 测地线流式核方法(GFK)

1.SGF

SGF思想:把source和target都分别看成是高维空间中的两个点,由source变换到target的过程就完成了domain adaptation。

SGF实现方法:把source和target分别看成高维空间(Grassmann流形)中的两个点,在这两个点的测地线距离上取d个中间点,然后依次连接起来。

SGF缺陷:不知道d怎么取

2.GFK

GFK解决了SGF问题
详情见以下博客

https://blog.csdn.net/qq_40824311/article/details/103984384?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522168536591816800226555621%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=168536591816800226555621&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allsobaiduend~default-1-103984384-null-null.142v88insert_down1,239v2insert_chatgpt&utm_term=GFK&spm=1018.2226.3001.4187

推导过程略为抽象,本人暂未明白测地线公式是如何推导出来的,但感觉测地线思想了解就行。
  1.积分用到了与核技巧一样的方法
  2.流形映射降维的思想
  3.领域间降维度量的思想
  4.principal angle这一度量(主角对角线元素的正弦值)

6. 从经验中迁移学习

主体思想:
  1.学习出一个变换矩阵W(对于所有迁移对最优,即平均误差最小)
  2.W应该能在有新数据时进行更新(即可进行增量学习)
  3.new question:类似于增量学习,如何最大限度地利用已有的迁移学习经验,使得其对新问题的泛化能力很好?同时也可以避免一出现新问题就从头进行学习

7. 负迁移

定义:
  负迁移指的是,在源域上学习到的知识,对于目标域上的学习产生负面作用。
产生负迁移的原因:
  1.源域和目标域压根不相似,谈何迁移?------数据问题
  2.源域和目标域是相似的,但是,迁移学习方法不够好,没找到可迁移的成分。 --------方法问题

8. 《Simultaneous Deep Transfer Across Domains and Tasks》文章解读

  目前所讲的迁移学习方法都是针对domain transfer(域之间的相似度,尤其是边缘分布),不注重task transfer(class之间的相似度)。文章针对target的部分class有少量label,剩下的class无label的情况将domain transfer和task transfer相结合。
  提出joint CNN architecture for domain and task transfer方法

在这里插入图片描述
soft label loss指的是:统计source中平均概率,作用于target概率,再计算loss

9.开放集迁移学习

在这里插入图片描述
  以往的方法都是基于Close set,现提出Open set想法
Method
利用source和target关系,给target打标签。

同理,在有一部分有标签条件下引入标签作为约束,但文章并未详述。

10.张量迁移学习

相当于把多维向量运算转换成张量运算,用的也是与PCA相当的降维方法(Tucker分解)
优化方法:
在这里插入图片描述
优化方法
  即Tucker分解出两个域共有共享的子矩阵用作矩阵变换,计算变换后与源域目标域之间的差异。
在这里插入图片描述
进一步优化:优化成线性变换的形式,用于差异更大的情况
在这里插入图片描述

12.学习资源仓库

【Github仓库地址:jindongwang/transferlearning】

13.在线迁移学习

在线迁移学习(Online Transfer Learning, OTL)
Method: 基于SVM以及集成学习进行组合

SVM分类器形式
在这里插入图片描述

基于同构的迁移学习
在这里插入图片描述
  首先对源域分类器和样本分类器归一化,w表示权重,谁影响大谁权重高。

基于异构的迁移学习
在这里插入图片描述
  运用多视图学习思路,把与源域相同特征的看为视图1,不同的看为2,将两视图上的分类器结合。

14.用于部分迁移学习的深度加权对抗网络

动机:源域的类别比目标域的多,无法直接进行迁移,那么,就首先选择出源域中与目标域那部分类别最接近的样本,给它们赋予高权重,然后进行迁移。
在这里插入图片描述

15.自动选择源域的迁移学习方法

动机:源域太多了该如何选择
Method:巧妙地绕过这一点,直接通过降维矩阵构建分类器。
构建一个迁移学习分类器。我们假设要学习一个线性模型,那么这个模型的权重向量就是W.这个模型的一般形式如下所示:
在这里插入图片描述
通过最小化误差来学习权重。

16.探秘任务迁移

本文所研究的问题情境:Domain相同,task不同

Method:首先我们要对不同任务进行建模,然后让它们两两之间进行迁移并获取迁移的表现。接着为了构建一个统一的字典,我们对这些迁移结果进行归一化。最后,我们构建可迁移图。
  1.针对目标的建模
  用的是编码-解码机制
  2.迁移学习的建模
在这里插入图片描述

  3.任务相似性标准化
在这里插入图片描述

  4.计算可迁移图
  得到任务相似度矩阵后,我们的事情就简单了。我们需要在这个矩阵里找一条路,选择从多个源域到 t 的这条路上,迁移表现最好。

Experiments
从中我们得出的结论是,如果能够选择好源域任务,那么通常来说迁移学习的表现都要比直接从目标领域训练要好

18.深度迁移度量学习

20.深度迁移学习用于时间序列分类

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/12547.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

突发!美团王兴躬身入局,AI大模型赛道还有谁?

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 3月8日,美团创始人王兴在朋友圈中透露,将以个人身份参与王慧文创业公司“光年之外”的A轮投资,并出任董事。 他表示:“AI大模型让我既兴奋于即将创造出来的巨大生产力&#xf…

刺激!ChatGPT给我虚构了一本书?

ChatGPT很强大,可以帮我们处理很多问题,但这些问题的答案的正确性您是否有考证过呢? 昨晚,DD就收到了一个有趣的反馈: 提问:有什么关于数据权限设计的资料推荐吗? ChatGPT居然介绍了一本根本不存…

chatgpt赋能python:Python如何考证?

Python 如何考证? Python 是一种高级编程语言,由于其易读易学和灵活性,越来越受到开发者和企业的青睐。因此,掌握 Python 编程技能能够为您的职业发展带来很大的帮助。但是,如何证明您真正精通 Python 编程呢&#xf…

chatgpt赋能python:Python考证在社会怎么报名

Python考证在社会怎么报名 Python是当今世界上最为流行和应用广泛的编程语言之一。在各种行业和领域中,Python都是一个不可或缺的工具。为了证明python编程水平的专业性和可靠性,越来越多的人选择参加Python考试。这篇文章将介绍Python考证相关的信息以…

chatGPT智能AI4.0版本正式上线!GPT4.0和3.5版本你会怎么选?

经过多轮技术升级和产品稳定测试,我们的技术团队终于成功上线了chatGPT智能AI4.0版本。这是一项具有里程碑意义的成就,因为GPT4.0版本是目前公认的最强大的自然语言处理模型之一,能够生成更高质量的自然语言文本,包括文章、对话、…

井底之蛙管中窥世界,狂野少年静耕自家田

我的研究方向是机器视觉,去年加入到我们课题组以来,已经过去了一年的时间。正如王国维《人间词话》所说:“古今之成大事业、大学问者,必经过三种之境界”,不知是我天生热爱探索的性格,还是受到了中华传统国…

OpenAI CEO亮相“AI春晚”,与张宏江隔空问答:10年内会有超强AI

《AI未来指北》栏目由腾讯新闻推出,邀约全球业内专家、创业者、投资人,探讨AI领域的技术发展、商业模式、应用场景、及治理挑战。 文 / 腾讯科技 苏扬 、郝博阳 凭借ChatGPT走红的OpenAI,成为行业争相追逐的对象,刚刚,…

诸神之战!一文盘点中国“大模型”玩家们

开年以来,全球 AI 大模型行业,鲜花着锦,比肩继踵。微软、Google、Meta、百度等科技巨头你追我赶,掀开了大模型“军备竞赛”时代的序幕。新的挑战者入局,大模型概念不断走高,众多 AI 企业纷纷宣告进军&#…

Chat的提问工程师,要上线了你慌不慌?

一、什么是Prompt? (1)Prompt的概念 我们在使用GPT的时候,给GPT发送的消息就是Prompt. 例如,当我们问ChatGPT"WPS是什么软件?"时: 其中,"WPS是什么软件?"这句话就是Prompt. (2)为什么要学习Prompt? Prompt是我们和GPT交流的方式,我们需要让GPT了解…

前端已死?全栈当立?取法于中,仅得其下。

开篇明义,前端已死?根本就是扯淡。前端技术精微渊深,驳杂宽广,除了基础的 HTML、CSS 和 JavaScript 技术外,前端技术还涉及到许多其他相关技术和工具,比如前端框架、UI 库、自动化构建工具、代码管理工具等…

我发现ChatGPT的一个规律,只要向他确认它就可能否定自己先前的回答

今年以来ChatGPT火爆了,我也经常使用它来做一些文案优化,很多时候确实挺聪明的。 例如: 我的问题:玉皇大帝住平流层还是对流层 它的回答:玉皇大帝是道教中的神明,关于他的居住地在道教经典中并没有明确的…

985本科生虽然水,但学历还是很管用!

原文链接: https://www.zhihu.com/question/354234322 01 前言 最近网上有个话题比较有争议:「为什么有些 985、211 的本科学生即使在大学里混得很水,在找工作时学历却那么管用?」考上了重点大学,就真的能够高枕无忧了…

Stable Diffusion云端部署只需三步, 不吃电脑配置, 模型快速部署

牙叔教程 简单易懂 我是小白, 小白跟我一步一步做就可以了, 鼠标点两下就OK了, 学点新东西, 好吗? 不想学的就走吧, 离我远点. Stable Diffusion是什么 Stable diffusion是一个基于Latent Diffusion Models(潜在扩散模型,LDMs)的文图生成…

ChatGLM-6B的P-Tuning微调详细步骤及结果验证

文章目录 1. ChatGLM-6B 1.1 P-Tuning v2简介 2. 运行环境 2.1 项目准备 3.数据准备4.使用P-Tuning v2对ChatGLM-6B微调5. 模型评估6. 利用微调后的模型进行验证 6.1 微调后的模型6.2 原始ChatGLM-6B模型6.3 结果对比 1. ChatGLM-6B ChatGLM-6B仓库地址:https://g…

源码中常见的 where 1=1 是一种高级优化技巧?

你是否曾在 SELECT 查询中看到过 WHERE 11 条件。我在许多不同的查询和许多 SQL 引擎中都有看过。这条件显然意味着 WHERE TRUE,所以它只是返回与没有 WHERE 子句时相同的查询结果。此外,由于查询优化器几乎肯定会删除它,因此对查询执行时间没…

启动您的 MySQL 查询:ChatGPT 如何帮助您检索 MySQL 数据

本文涉及到的相关软件,dbForge Studio for MySQL和ChatGPT,在您尝操作前,请务必先确保两个程序都正常运作哦,废话不多说,开始上干货! Devart 提供包括Oracle、SQL Server、MySQL、PostgreSQL、InterBase以及Firebird在…

ChatGPT与深度学习的完美融合:打造智能化推荐系统新时代

PNN | AutoRec | 推荐算法 NFM | ChatGPT | 深度学习 新技术如ChatGPT、LLM、AIGC等的兴起,使推荐系统拥有更强的学习和预测能力。然而,推荐算法仍然是深度学习推荐系统中不可或缺的关键技术。推荐算法和这些技术应相辅相成,相互补充。推荐…

为什么有些 985 的本科学生即使在大学里混得很水,在找工作时学历却那么管用?...

大家好,我是老赵 最近网上有个话题比较有争议:「为什么有些 985、211 的本科学生即使在大学里混得很水,在找工作时学历却那么管用?」考上了重点大学,就真的能够高枕无忧了吗?让我们一起来了解一下吧。 我做…

如何使用租用的云服务器实现神经网络训练过程(超详细教程,新手小白适用)

超级感谢up主7_xun的B站教学视频:适合深度学习小白的CV实战——在AutoDL上租用云服务器跑YOLOv5的全过程 链接:https://www.bilibili.com/video/BV1jA4y1o7Ph/?spm_id_from333.1007.top_right_bar_window_history.content.click&vd_sourcee482aea0f…

FBEC大会 | 全球元宇宙CEO峰会演讲干货汇总

2023年2月24日,由广东省游戏产业协会、深圳市互联网文化市场协会指导,陀螺科技主办的FBEC未来商业生态链接大会,在深圳福田大中华喜来登酒店6楼宴会厅盛大召开! FBEC大会以“勇毅前行逐光而上”为主题,以具有行业前瞻洞…