凯发娱乐城

注册游戏账号

新葡京娱乐城

进入游戏大厅

博天堂娱乐城

真人棋牌游戏开户

您现在的位置:网投乐园>游戏问答> 正文

田渊栋团队新作神经网络“彩票假设”可泛化强

来源:http://www.wangtouleyuan.com 作者:游戏问答

真人棋牌游戏

博天堂

  双人答题游戏好玩的答题游戏【新智元导读】ICLR src="https://pic1.zhimg.com/v2-2ea52e4a9da0be3cba4d2427c6e3a33c_b.jpg">
田渊栋团队新作神经网络“彩票假设”可泛化强
为了找到中奖彩票,我们使用随机初始化来训练一个完整的网络,在保留其性能的同时修剪模型,然后在训练开始前将子网络重置(或倒回)到初始化。为了评估中奖彩票,我们将它们与随机彩票进行比较,并发现中奖彩票(或幸运初始化)表现得更好。随着网络规模的增大,我们组合地增加了可能的子网络的数量,这意味着存在一个幸运的子网络初始化的概率更高。彩票假设表明,如果我们能找到这个幸运的子网络,我们就能将小的、稀疏的网络训练到高性能,即使删除了整个网络90%以上的参数。然而游戏问答,找到中奖彩票需要大量的计算资源,因为模型必须经过多次训练和再训练,这使得跨问题设置的泛化成为改进深度神经网络的一个关键标准。
跨数据集和优化器进行泛化
到目前为止,研究人员只是在原始研究论文中用于寻找中奖彩票的完全相同问题上测试了这一假设,部分原因是在新设置下寻找中奖彩票所需的计算能力太大。
在我们今年在NeurIPS上发表的论文“One ticket to win them all: generalizing lottery ticket initializations across datasets and optimizers”中,我们评估了6个不同的自然图像数据集和优化器中彩票初始化的通用性。令人鼓舞的是,我们发现中奖彩票普遍适用于相关但不同的数据集。类似地,我们还发现中奖彩票在不同的优化器中都是通用的,这表明中奖彩票初始化在很大程度上是与优化器无关的。
田渊栋团队新作神经网络“彩票假设”可泛化强
论文地址:
为了度量中奖彩票的通用性,我们在一个源训练配置中生成中奖彩票,并在不同的目标配置中评估性能。例如,我们可以使用CIFAR-10数据集(源配置)生成中奖彩票,并在ImageNet数据集(目标配置)上评估它的性能。通过一系列不同设置的严格实验,我们观察到中奖彩票在不同的图像数据集上可以泛化。有趣的是,我们还观察到,由大型数据集(如ImageNet和Places365)生成的中奖彩票的迁移效果始终比小数据集(如CIFAR-10)好得多。
田渊栋团队新作神经网络“彩票假设”可泛化强
这些图显示了物体分类模型的中奖彩票是如何跨越大型数据集(ImageNet和Places365)和小型数据集(CIFAR-10/CIFAR-100)的。图中不同的线代表中奖彩票的不同源数据集游戏问答。在ImageNet和Places365上生成的中奖彩票始终优于在较小数据集上生成的中奖彩票。
这些结果表明,与较小的数据集相比,较大的数据集会鼓励更多的通用中奖彩票。我们还发现,在相同数量的训练示例(但类别数量不同)的数据集上生成的中奖彩票的表现也有所不同。类别更多似乎就可以更好地泛化(例如,比较CIFAR-10和CIFAR-100中奖彩票的性能,它们分别有10个类和100个类)。
这项研究表明,无论确切的问题是什么,中奖彩票都包含有改善深度神经网络训练的一般属性。这样就有可能产生少量这样的中奖彩票,并在不同的任务和环境中使用它们进行更有效的训练。(要了解更多细节,请阅读论文:One ticket to win them all: Generalizing lottery ticket initializations across data sets and optimizers)。
推广到其他领域和其他学习方法:强化学习和NLP
到目前为止,彩票现象只在以视觉为中心的分类任务这样的监督学习环境中进行了测试,这留下了一个关键的开放性问题——它们是否只存在于监督学习方法中,或者仅是图像分类领域的一个巧合?如果彩票现象代表了DNN的基本属性,那么中奖彩票应该出现在各种不同的领域和学习环境中。
在最近的论文“Playing the lottery with rewards and multiple languages: lottery tickets in RL and NLP”中,我们研究了这些问题,发现彩票现象也存在于强化学习(RL)和自然语言处理(NLP)领域。对于RL,我们分析了一组经典的控制任务和Atari游戏;对于NLP,我们研究了经典的长短时记忆(LSTM)语言模型和最近的为机器翻译训练的Transformer模型。
我们关注的任务与最初用于图像分类和监督学习的范例和架构有很大的不同。例如,在RL中,数据分布会随着智能体从稀疏的奖励信号中学习而发生变化,这显著地修改了优化过程和生成的网络。在NLP任务中,DNN需要对时间动态进行建模,而这在有监督的图像分类中是不存在的。
田渊栋团队新作神经网络“彩票假设”可泛化强
论文地址:
与之前的监督图像分类的工作一致,我们证实了在RL和NLP问题中,中奖彩票的表现也优于标准随机子网络初始化,即使在极端的剪枝率下也是如此。对于RL,我们发现在经典控制问题和许多(但不是全部) Atari游戏中,中奖彩票的表现远远好于随机彩票。
田渊栋团队新作神经网络“彩票假设”可泛化强
为机器翻译任务训练的Transformer 模型的中奖票初始化性能对于NLP模型,我们发现在语言建模任务训练的LSTM和机器翻译任务训练的Transformer中都存在中奖彩票。令人惊讶的是,我们发现拥有超过2亿个参数的超大型Transformer模型可以从零开始训练到接近等效的性能,而只剩下三分之一的权重。这一结果表明,我们有可能从头开始构建和训练基于注意力的语言模型,这些模型被大大简化,足以适应小型设备。
总之,这些结果表明彩票现象并仅仅是图像分类的产物,而是代表了深度神经网络(DNN)这个广泛领域的一种现象。(关于这些实验的详细信息,请阅读论文:Playing the lottery with rewards and multiple languages: lottery tickets in RL and NLP。)
进一步加深对“中奖彩票”的理解
这些研究有助于证明彩票可以在原始研究论文的确切条件之外存在,这为我们加深对幸运初始化的理解提供了更多的激励。然而,还有很多关于神经网络的潜在属性和行为的开放性问题,比如这些中奖彩票是如何形成的,它们为什么存在,它们是如何工作的?
为了在深层ReLU网络的背景下开始分析这些问题,我们使用了一个“学生-教师”的设置,在这个设置中,一个较大的学生网络必须学会准确地模仿较小的教师网络正在做的事情。由于我们可以在此设置中定义具有固定参数的教师网络,因此我们可以定量地测量学生网络的学习进度,并且,对于我们的彩票研究来说,了解学生网络的初始化如何影响学习过程是至关重要的。
在“学生-教师”设置下的研究中,我们发现,经过训练后,被挑选出来的学生神经元的活动模式与教师神经元的活动模式之间的相关性比与其他学生神经元的活动之间的相关性更强——这一概念被称为“学生专业化”(student specialization)。这种更强的相关性表明,在训练期间,学生网络不仅学习教师的网络输出,而且可以通过模仿个别老师的神经元来学习教师网络的内部结构。
在论文“Luck Matters: Understanding Training Dynamics of Deep ReLU Networks”的分析中,我们发现这种现象发生在一个2层的ReLU网络中:如果一个学生神经元的初始权重碰巧与某些教师神经元的权重相似,那么就会出现专门化。神经网络的大小很重要,因为学生网络越大,越有可能存在一个学生神经元与教师神经元的距离很接近,从而在训练中模仿教师神经元的活动。更重要的是,如果一个学生神经元的初始激活区域与一个教师神经元有更多的重叠,那么这个学生神经元的就会更快地专业化。这一行为证实了彩票假设,该假设同样提出,在神经网络中存在一些幸运的初始化子集,“中奖彩票”就是幸运的学生神经元,它们恰好在训练开始时处于正确的位置。
田渊栋团队新作神经网络“彩票假设”可泛化强
论文地址:
在我们的后续研究论文“Student Specialization in Deep ReLU Networks With Finite Width and Input Dimension”中,我们通过消除多种数学假设(包括独立激活和局部性)来强化我们的结果,并且仍然证明了学生专业化在经过训练后发生在深层ReLU网络的最底层。从我们的分析中,我们发现训练动态中的某些数学性质与彩票现象产生了共鸣:那些在初始化时具有轻微优势的权重,在训练收敛后成为中奖彩票的可能性更大。
田渊栋团队新作神经网络“彩票假设”可泛化强
论文地址:
通过这个“教师-学生”范式,我们已经能够从数学上证明幸运初始化的彩票行为——超出了经验实验。
彩票假设的未来和开放性问题
彩票假设是一个令人兴奋且潜力巨大的视角,通过它我们可以更好地理解和改善DNN。
通过这一系列的研究和理论分析,我们证明了彩票效应可以发生在各种不同的领域,中奖彩票的初始化能够在相关但不同的数据集进行泛化,以及更一般的意义上,他们比先前研究人员所理解的更有潜力。如果我们能找到一种方法,从一开始就识别出中奖彩票,那么我们不仅可以用今天所使用的计算资源的一小部分来构建强大的深度学习系统,而且还可以使用这些技术来提高当前的大型网络的性能。
虽然我们的研究已经证明了彩票假设的普遍性,并且我们的理论框架有助于更具体地证实这一现象,但这是一个活跃的研究领域,有许多问题仍然没有得到解答。中奖彩票是依赖于标签还是仅仅依赖于数据分布?如何更有效地生成中奖彩票?是否有可能在不同的架构之间迁移中奖彩票?也许最有趣的是,是什么让中奖彩票如此特别?我们希望这些工作将推动我们的团队和其他人今后的研究,探讨这些悬而未决的问题。


原文链接:

  • 原文标题:田渊栋团队新作神经网络“彩票假设”可泛化强
  • xpj

    9you娱乐城

    特别推荐

    
  • 谷歌搜索留痕推广
  • 谷歌搜索留痕排名技术
  • 谷歌快速排名
  • 留痕方法
  • 谷歌搜索快速方法
  • google搜索留痕程序
  • 谷歌快速排名
  • 澳门太阳城
  • 最大博彩公司
  • 谷歌搜索关键词排名
  • 搜索留痕程序
  • 谷歌排名出售
  • 谷歌蜘蛛池排名
  • 搜索留痕软件
  • 缅甸果敢赌场
  • 电子游艺规则
  • 谷歌留痕推广
  • google引流程序
  • 谷歌快速排名
  • google引流程序
  • 留痕推广
  • 大西洋城赌场
  • 买球地址
  • 搜索留痕
  • 搜索留痕程序出售
  • 谷歌蜘蛛池排名技术
  • 留痕程序
  • 如何提高google搜索排名
  • 数字币博彩
  • 洗钱方法
  • Google留痕收录
  • 最新谷歌搜索留痕排名
  • 搜索留痕
  • Google留痕收录
  • google搜索留痕
  • 数字币博彩网站
  • 足球投注平台
  • 博彩推广话术
  • 推广引流方法
  • 引流方法
  • 博彩推广话术
  • 网上博彩推广引流
  • 数字币赌场
  • 皇冠现金网
  • 蜘蛛池排名
  • 谷歌蜘蛛池
  • 留痕程序出售
  • google搜索留痕程序
  • 比特币网上赌场
  • 洗钱平台
  • 搜索留痕
  • 博彩推广方式
  • 网上博彩推广
  • 快速排名
  • 搜索留痕程序
  • bbin平台大全
  • 体育博彩公司排名
  • 留痕排名技术
  • 最新谷歌关键词排名
  • 推广渠道
  • 谷歌快速排名
  • 博彩推广
  • 世界杯赌球地址
  • 皇冠博彩公司
  • 谷歌排名出售
  • 博彩引流渠道
  • 搜索留痕程序
  • google搜索留痕
  • 引流渠道
  • 果敢网上赌场
  • 世界杯赌球
  • 搜索留痕方法
  • 博彩搜索留痕
  • 博彩引流
  • 博彩引流
  • 搜索留痕
  • 缅甸网上赌场
  • 欧洲杯赌球
  • 谷歌搜索排名
  • 留痕程序
  • 网上博彩推广引流
  • 留痕技术
  • 搜索留痕技术出售
  • 澳门威尼斯人网上赌场
  • 外围博彩
  • 博彩网站推广
  • 推广引流
  • 留痕程序出售
  • 谷歌推广引流技术
  • 推广引流方法
  • 美国在线赌场
  • 沙巴体育投注平台
  • 最新谷歌搜索留痕
  • 谷歌蜘蛛池排名技术
  • 网站推广方法
  • 留痕程序出售
  • 博彩推广方法
  • 菠菜论坛
  • 买球平台
  • 谷歌搜索留痕
  • 蜘蛛池排名
  • 博彩公司推广渠道
  • 谷歌搜索留痕
  • 博彩公司推广渠道
  • 真钱游戏
  • 网上赌球地址
  • 赌球平台推荐
  • 赌球网址
  • 博彩包网
  • 买球app
  • 澳门博彩公司
  • 威尼斯人赌场
  • 博彩平台推荐
  • 美国博彩网站
  • 缅甸实体赌场
  • 柬埔寨网上赌场
  • 柬埔寨在线赌场
  • 韩国博彩
  • 支持人民币的博彩公司
  • 世界五大比特币交易所
  • 欧易是哪个国家的
  • 中币跑路
  • 亚洲博彩公司
  • 合法网上赌场
  • 马尼拉赌场
  • 支持人民币的博彩公司
  • 大陆博彩平台
  • 澳门新葡京娱乐城
  • 老挝赌场
  • 世界赌场排名
  • 网上博彩公司排行
  • 菠菜论坛
  • 东南亚赌博网站
  • 虚拟币博彩
  • 澳门百家乐网址
  • 网上博彩导航
  • 区块链百家乐游戏
  • 马来西亚博彩公司
  • 越南赌场
  • 区块链百家乐
  • 香港娱乐场
  • 澳大利亚赌博网站
  • 足球赔率
  • 菲律宾网上赌场
  • 数字币博彩网站
  • 足球投注网站
  • 百家乐论坛
  • 皇冠体育博彩公司
  • 网上赌博网站
  • 网上博彩推广话术
  • 谷歌搜索快速方法
  • 网上博彩推广话术
  • 数字币赌场
  • 皇冠博彩公司
  • 世界杯博彩公司
  • 英国博彩公司
  • 网上博彩合法化
  • 新加坡赌场
  • 比特币网上赌场
  • 怎么洗钱
  • 加密货币博彩平台
  • 世界杯赌球网址
  • 网上赌球地址
  • 博彩推广方式
  • 印度尼西亚博彩公司
  • 国际包网
  • bbin平台直营
  • 亚洲体育博彩平台
  • 越南博彩公司
  • 百家乐路单
  • 澳门博彩官网
  • 博彩网推荐
  • 澳门太阳城网址
  • 百家乐网址
  • 世界杯赌球网址
  • 皇冠博彩网址
  • 洗钱方法
  • 买球网站
  • 欧洲杯赌球平台
  • 皇冠现金网
  • 外围赌球平台
  • 果敢赌场
  • 买球技巧
  • 全球最大博彩公司
  • 电子游艺
  • 真人电子游戏
  • 骰宝游戏规则
  • 亚洲体育博彩平台
  • 澳门在线赌场
  • 缅甸赌场地址
  • 赌球平台
  • 赌场如何赢钱
  • 世界杯买球网站
  • 真人牌九游戏
  • 世界杯买球官网
  • 时时彩平台
  • 六合彩预测
  • 威尼斯人网上赌场
  • 外围赌球网站
  • 赌博网址
  • 彩票群
  • 微信赌博群
  • 韩国首尔赌场
  • 赌钱游戏
  • 美国网上赌场
  • bbin官网
  • 沙巴体育官网
  • 博彩平台推荐
  • 数字币博彩网站
  • 比特币网上赌场
  • 世界赌场名单
  • 美国赌场攻略
  • 菠菜论坛排名
  • 菠菜论坛排名
  • 缅甸网上赌场
  • 支持人民币的博彩公司