机器学习的遗忘——基于文章“Forgetting“ in Machine Learning and Beyond: A Survey

文章概要

这篇调查文章仅关注选择性遗忘,承认遗忘某些信息可以通过允许模型优先考虑和保留更重要或相关的信息,以及保护用户隐私,从而带来好处。选择性遗忘(Selective forgetting)涉及有选择地忽略无关或噪声数据。这种形式的遗忘有助于优化模型的内存利用,提高其概括能力,并增强其对不同数据集和任务的适应性。
本文调查了机器学习文献中的遗忘现象,以回答以下研究问题:
[RQ1]:遗忘在不同知识领域(如心理学、哲学、神经科学)中是如何体现的?这个研究问题探讨了遗忘的多方面性质,以激发在机器学习方法中开发新的遗忘模型。
[RQ2]: 遗忘如何用于遵守数据隐私法,减少偏见并在机器学习方法中优先处理相关信息?
[RQ3]: 在机器学习中实施遗忘机制有哪些未来的研究机会和挑战?在这里,我们探索当前的研究空白,以推动该领域的发展。

机器学习中的遗忘

  • 遗忘过程如何被塑造?
    一个关键方法是建立反馈机制或控制和监控回路。遗忘是一个依赖于反馈信号的动态系统,这些信号表现为认知感受,作为现象学反馈,指导我们在何时以及如何遗忘。

  • 遗忘中的挑战
    一个值得注意的关注点是哲学和语言学中讨论的伦理问题。遗忘作为对记忆的反映,显著地塑造了我们对伦理、道德责任、历史、政治以及过去和未来的看法。鉴于这种影响,当处理机器学习系统的遗忘行为时,必须谨慎行事。不同类型的数据及其在模型训练过程中的权重可能会影响模型的推理和决策能力。因此,在这个背景下,仔细考虑与遗忘相关的伦理关切和偏见是至关重要的。另一个需要考虑的重要方面是偶然遗忘的界限,因为并非所有的遗忘情况都会产生积极的结果。在教育理论中,过度遗忘可能会使问题解决变得过于具有挑战性,潜在地阻碍学生的学习流程通道,从而产生负面体验 同样,不适当的存档实践可能会导致机器学习模型的灾难性遗忘和荒谬的决策制定,这给我们带来了新的挑战,即确定不同类型训练任务中适当的遗忘界限,确保遗忘被有效和适当地应用。

机器学习的分类

请添加图片描述

  • Dimension
    • Content遗忘的内容:物体、标签、类别、任务、数据流
    • Recoverabilty可恢复性:
      • 不可恢复遗忘【信息无法恢复,通常涉及隐私或版权,处理更广泛的记忆】
      • 可恢复性遗忘【暂时搁置预训练的知识后引入模型、提供灵活的学习策略】
        • 短暂遗忘:模型对特定事物的记忆会随着时间的推移而减弱,但有可能恢复
        • 抑制遗忘:模型故意对某些记忆设置障碍,除非移除障碍,否则很难回忆起那些特定的细节
        • 梯度遗忘:以不同的速度遗忘不同的事物,因为它的学习或优化知识的方式是可以调整的
    • Extent遗忘程度:
      • 精确遗忘:移除样本后,模型的输出与从未在移除的样本上训练过的模型的输出相同
      • 近似遗忘:保留了被遗忘知识的缩小版或效力较低的版本,无需从头训练模型(常用于当人们想要保持一定程度的适应性或重新审视和微调以前学习过的信息的能力,同时减少其对模型的当前影响时)
  • Approch
    • active forgetting主动遗忘:目标是更新信息以提高性能。这是迁移学习的主要内容,使用不同域的知识提升机器学习模型。通过遗忘改善消极迁移NT,增强模型的泛化能力,防止模型对训练数据出现过拟合。模型可以采用选择性遗忘来丢弃噪音和不相关的细节,而不是保留所有信息。
    • passive forgetting被动遗忘:仅在响应特定请求以保护用户隐私和增强安全性时发生。除了删除对应的训练数据,还要消除其对模型训练结果的影响(反学习)。重新训练显然在计算时费时费力,应i希望修改机器模型和数据集进行近似反学习
      请添加图片描述
      反学习:
      请添加图片描述

遗忘方法(主动学习)

三个研究方向:遗忘以减轻负迁移;遗忘以增强对未见数据的泛化能力;遗忘以释放存储空间

1. 域相似估计——for NT

由于源域和目标域的差距导致NT,因此在NT前实施主动遗忘策略。

  • Feature statistics-based approaches
  • Test-prediction-based approaches
  • Fine-tuning-based approaches:通过修改较高层的参数同时保留较低层的权重,将预训练模型调整到新的目标域
2. NT mitigation approaches

该过程通过主动遗忘得到有效管理,即故意丢弃或淡化特定知识以增强目标域的结果

  • data transferability:多域、多类
  • model transferability:对于模型可迁移性,通过可迁移批量规范化等方法增强源模型训练,使模型能够优先考虑更具适应性的特征并“忘记”不太相关的特征
    • Training process enhancement涉及管理训练动态,例如在优化过程中改变步长和方向,由超参数𝜆引导。
    • Target prediction enhancement目标预测增强采用软伪标记、选择性伪标记、聚类增强伪标记和熵正则化等技术。这些方法通过“忘记”嘈杂或不相关的标签和数据,使模型能够适应新的领域,从而提高目标领域的预测精度。
3.Iterative training

通过迭代改进机器学习模型以增强其泛化能力。Knowledge Evolution、Iterative Magnitude Pruning
Eg.RIFLE,这是一种定期重新初始化模型最后一层以减少对特定特征的依赖的方法,从而鼓励学习更广泛的模式。这种方法以及利用合成机器翻译语料库和迭代自提炼的策略,通过利用反向翻译和连续教学迭代有效地增强了学习。
“迭代学习”方法在增强组合性方面非常有效。Eg.later-layer forgetting (LLF)策略,该策略涉及重新初始化网络的后层以专门删除与复杂示例相关的信息,从而促进“遗忘和重新学习”范式。迭代再训练过程”中,一致理解的特征会得到强化。

4.Improve attention’s efficiency
  • Yuhuai Wu等人通过引入 kNN 查找和不可微分的外部存储器,提供了一种 scale transformers的创新方法。这些技术使模型能够有效地管理其注意力机制,专注于必要的细节,同时“忘记”不必要的计算。
  • 用于组织巩固记忆的各种控制策略被总结为一个统一的抽象:具有有界记忆控制的注意力(ABC)[170]。
  • [169] 中引入的𝐴𝐵𝐶𝑀𝐿𝑃作为 ABC 的一个实例,引入了一个神经网络来确定如何将每个标记存储在记忆中,以在准确性和效率之间取得更好的平衡。
5. Lossless compression
  • [203]引入了 Expire-span ,为每个内存计算特定的使用寿命(图 9)。一旦内存超过其使用寿命,它就无法访问。
  • RECOMP[250] 是为提高视觉语言模型性能而提出的,其操作方式是先检索文档,然后将其压缩为摘要,然后再进行同化。该模型使用两种压缩器类型:一种是选择关键句子的提取式压缩器,另一种是从多个来源生成摘要的抽象式压缩器。这些压缩器旨在增强语言模型的任务性能,如果文档不相关,还可以选择“选择性增强”,即返回空字符串。这种选择性方法反映了 transformer 中的“遗忘”概念,简化了信息输入,以确保模型准确性和效率之间的最佳权衡。
  • TRIME [268] 强调记忆类型分类,引入了在测试期间针对不同记忆类型的记忆构建和数据批处理方法。
  • Item2Vec++ (AI2V++) 模型提出了一种神经注意力协同过滤方法,其中用户表征在推荐项目存在的情况下会动态调整 [67]。

https://mp.weixin.qq.com/s/ddGhxUwHpx3PJD3dJmZQ6w
https://arxiv.org/pdf/2405.20620v1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/783235.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C语言 | Leetcode C语言题解之第220题存在重复元素III

题目&#xff1a; 题解&#xff1a; struct HashTable {int key;int val;UT_hash_handle hh; };int getID(int x, long long w) {return x < 0 ? (x 1ll) / w - 1 : x / w; }struct HashTable* query(struct HashTable* hashTable, int x) {struct HashTable* tmp;HASH_F…

亚马逊如何用自养号测评打造权重提升排名带来更多的自然流量

亚马逊通过自养号测评来提升流量是一种被广泛采用的运营手段&#xff0c;它可以帮助卖家快速提高商品的曝光度和吸引潜在买家。以下是自养号测评的详细分析&#xff1a; 一、自养号测评的定义与原理 自养号测评是指卖家通过注册并管理海外买家账号&#xff0c;对自家商品进行…

PyQT: 开发一款ROI绘制小程序

在一些基于图像或者视频流的应用中&#xff0c;比如电子围栏/客流统计等&#xff0c;我们需要手动绘制一些感兴趣&#xff08;Region of Interest&#xff0c;简称ROI&#xff09;区域。 在这里&#xff0c;我们基于Python和PyQt5框架开发了一款桌面应用程序&#xff0c;允许用…

java中Request和Response的详细介绍

1.Request和Response的概述 # 重点 1. service方法的两个参数request和response是由tomcat创建的void service(ServletRequest var1, ServletResponse var2) 2. request 表示请求数据, tomcat将浏览器发送过来的请求数据解析并封装到request对象中servlet开发者可以通过reques…

AI免费英语学习在线工具:Pi;gpt;其他大模型AI 英语学习智能体工具

1、pi(强烈推荐&#xff1a;可以安卓下载使用) https://pi.ai/talk &#xff08;网络国内使用方便&#xff09; 支持实时聊天与语音对话 2、chatgpt&#xff08;强烈推荐&#xff1a;可以安卓下载使用) https://chat.openai.com/ &#xff08;网络国内使用不方便&#xf…

element-ui el-select选择器组件下拉框增加自定义按钮

element-ui el-select选择器组件下拉框增加自定义按钮 先看效果 原理&#xff1a;在el-select下添加禁用的el-option&#xff0c;将其value绑定为undefined&#xff0c;然后覆盖el-option禁用状态下的默认样式即可 示例代码如下&#xff1a; <template><div class…

27_电子电路设计基础

电路设计 电路板的设计 电路板的设计主要分三个步骤&#xff1a;设计电路原理图、生成网络表、设计印制电路板。 (1)设计电路原理图&#xff1a;将元器件按逻辑关系用导线连接起来。设计原理图的元件来源是“原理图库”,除了元件库外还可以由用户自己增加建立新的元件&#…

@Builder注解详解:巧妙避开常见的陷阱

欢迎来到我的博客&#xff0c;代码的世界里&#xff0c;每一行都是一个故事 &#x1f38f;&#xff1a;你只管努力&#xff0c;剩下的交给时间 &#x1f3e0; &#xff1a;小破站 Builder注解详解&#xff1a;巧妙避开常见的陷阱 前言1. Builder的基本使用使用示例示例类创建对…

YOLOv5改进系列(32)——替换主干网络之PKINet(CVPR2024 | 面向遥感旋转框主干,有效捕获不同尺度上的密集纹理特征)

【YOLOv5改进系列】前期回顾: YOLOv5改进系列(0)——重要性能指标与训练结果评价及分析 YOLOv5改进系列(1)——添加SE注意力机制 YOLOv5改进系列(2)——添加CBAM注意力机制 YOLOv5改进系列(3)——添加CA注意力机制 YOLOv5改进系列(4)——添加ECA注意力机制 YO…

21. Java AQS 原理

1. 前言 本节内容主要是对 AQS 原理的讲解&#xff0c;之所以需要了解 AQS 原理&#xff0c;是因为后续讲解的 ReentrantLock 是基于 AQS 原理的。本节内容相较于其他小节难度上会大一些&#xff0c;基础薄弱的学习者可以选择性学习本节内容或者跳过本节内容。 了解什么是 AQ…

从无计划到项目管理高手,只需避开这两大误区!

在项目管理的过程中&#xff0c;制定计划是不可或缺的一环。然而&#xff0c;在实践中&#xff0c;我们往往会遇到两种常见的误区&#xff0c;这些误区不仅阻碍了计划的有效实施&#xff0c;还可能让我们在追求目标的道路上迷失方向。 误区一&#xff1a;认为没有什么可计划的…

Nacos 国际化

项目需要&#xff0c;后端异常信息需要进行国际化处理。所有想有没有方便易用的可选项。 1、国际化配置调整&#xff0c;不需要重启系统 2、可支持添加不同或自定义语言包&#xff08;就是配置的资源文件&#xff09; 参考&#xff1a; Nacos实现SpringBoot国际化的增强_spr…

硅纪元视角 | Speak火了!3个月收入翻倍,OpenAI为何频频下注?

在数字化浪潮的推动下&#xff0c;人工智能&#xff08;AI&#xff09;正成为塑造未来的关键力量。硅纪元视角栏目紧跟AI科技的最新发展&#xff0c;捕捉行业动态&#xff1b;提供深入的新闻解读&#xff0c;助您洞悉技术背后的逻辑&#xff1b;汇聚行业专家的见解&#xff0c;…

LabVIEW自动探头外观检测

开发了一套基于LabVIEW的软件系统&#xff0c;结合视觉检测技术&#xff0c;实现探头及连接器外观的自动检测。通过使用高分辨率工业相机、光源和机械手臂&#xff0c;系统能够自动定位并检测探头表面的细微缺陷&#xff0c;如划痕、残胶、异色、杂物等。系统支持多种探头形态&…

王老师 linux c++ 通信架构 笔记(二)

&#xff08;7&#xff09;本条目开始配置 linux 的固定 ip 地址&#xff0c;以作为服务器使用&#xff1a; 首先解释 linux 的网口编号&#xff1a; linux 命令 cd &#xff1a; change directory 改变目录。 ls &#xff1a; list 列出某目录下的文件 根目录文件名 / etc &a…

Kubernetes运维工程师必备:K8s 基础面试题精编(一)

Kubernetes运维工程师必备:K8s 基础面试题精编(一) 1. 什么是Kubernetes?2. Kubernetes如何实现容器编排?3. 说出k8s的常见资源对象?4. 什么是pod?5. Deployment介绍及使用?6. statefulesets介绍及使用?7. statefulesets和deployment区别?8. 什么是调度器(Scheduler…

三菱PLC 实现PID控制温度 手搓PID指令!!!

目录 1.前言 2.PID公式的讲解 3.程序 4.硬件介绍 5.EPLAN图纸 6.成果展示 7.结语 1.前言 新手想要学习PLC的PID控制 首先会被大串的PID 公式吓到 PID公式有很多种&#xff1a;基本PID 位置式 增量式 模拟式 理想型 等等 但是 不要急 别看这么多公式 其实 将公式拆…

知识图谱驱动的深度推理:ToG算法的创新与应用

LLMs通过预训练技术在大量文本语料库上生成连贯且符合上下文的响应。然而&#xff0c;面对需要复杂知识推理的任务时&#xff0c;它们存在明显的局限性。这些问题包括对超出预训练阶段的专业知识的准确回答失败&#xff0c;以及缺乏责任性、可解释性和透明度。为了解决这些问题…

(19)夹钳(用于送货)

文章目录 前言 1 常见的抓手参数 2 参数说明 前言 Copter 支持许多不同的抓取器&#xff0c;这对送货应用和落瓶很有用。 按照下面的链接&#xff08;或侧边栏&#xff09;&#xff0c;根据你的设置了解配置信息。 Electro Permanent Magnet v3 (EPMv3)Electro Permanent M…

教育相关知识

教育的含义 教育的基本要素 教育的属性 教育的功能 教育的起源 教育的发展