今日看点

你对NLP的迁移学习爱的有多深?21个问题弄懂最新的NLP进展。

发表于话题:512的暗示
发布时间:2021-05-21

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”

作者:Pratik Bhavsar

编译:ronghuaiyang

导读

如果这21个问题你全部了解的话,你对最新的NLP进展的了解已经过关了。

2018年10月BERT发布之后发生了很多事情。

你知道BERT的掩码语言模型是老派模型吗?

你知道注意力的计算不需要平方时间复杂度吗?

你知道你可以偷用谷歌的模型吗?

我们这一代人中一些最聪明的人一直在紧张地工作,并有大量的产出!NLP现在是最性感的领域????

NLProc已经走了很长的路。

我们需要另一个总结!!

这20个问题会测试你对NLP当前状态的更新程度的了解,并为任何技术讨论做好准备。

什么是最新的预训练模型(PTM)?

https://arxiv.org/pdf/2003.08271.pdf

PTMs的训练任务是什么?

https://arxiv.org/pdf/2003.08271.pdf

在GLUE上,最好的PTMs是什么?

https://arxiv.org/pdf/2003.08271.pdf

更多的数据是不是总是可以得到更好的语言模型?

T5论文说不是的,质量比数量更重要。

https://arxiv.org/pdf/1910.10683.pdf

什么tokenisation方法对于训练语言模型是最好的?

这篇文章:https://arxiv.org/pdf/2004.03720.pdf,说一种新的方法Unigram LM要比BPE和WordPiece更好一些。

训练语言模型的最好的任务是什么

目前最好的方法是ELECTRA→在生成器的帮助下替换输入token,然后使用识别器来预测哪个token被替换了。

https://arxiv.org/pdf/2003.10555.pdf

https://arxiv.org/pdf/2003.10555.pdf

Also T5论文还说, dropping a span为3是最好的。

https://arxiv.org/pdf/1910.10683.pdf

Transformer训练的时候是否需要逐步的解冻参数?

T5 论文说不需要。

https://arxiv.org/pdf/1910.10683.pdf

如果你有固定的训练预算,你会通过改变什么来得到更好的语言模型?

T5 paper建议同时提升训练的步数和模型的大小。

https://arxiv.org/pdf/1910.10683.pdf

如果你的序列长度超过了512,你会用什么模型?

Transformer-XL或者Longformer

Transformer的处理时间随着序列的长度是怎么扩展的?

平方扩展。

如何降低长文档的transformers处理时间,因为它是序列长度的二次函数?

Longformer使用了一种随着序列长度线性扩展的注意力机制。

https://arxiv.org/pdf/2004.05150.pdf

Longformer在语义搜索中对编码长文档非常有用。下表显示了到目前为止所做的工作。

https://arxiv.org/pdf/2004.05150.pdf

BERT表现这么好是因为注意力层吗?

论文Attention is not Explanation认为注意力没有正确地与输出相关,因此我们不能说由于注意机制,模型的表现更好。

如果我们去掉一个注意力头,BERT的表现会下降很多吗?

不会 —见论文 Revealing the Dark Secrets of BERT

如果我们去掉一层,BERT的表现会下降很多吗?

不会 —见论文 Revealing the Dark Secrets of BERT

如果我们随机初始化BERT,BERT的表现会下降很多吗

不会 —见论文 Revealing the Dark Secrets of BERT

我们真的需要模型压缩吗?

也许不是!这篇文章的笔记:http://mitchgordon.me/machine/learning/2020/01/13/do-we-really-need-model-compression.html。

“模型压缩技术通过解释过度参数化模型趋向于收敛的结果类型,给我们一个关于如何训练适当参数化模型的提示。模型压缩有很多种类型,每一种都利用了一种不同类型的“简单性”,这种“简单性”通常在训练过的神经网络中可以找到:

许多权重接近于零(修剪)

权重矩阵是低秩的(权重分解)

权重能只用几个位表示(量化)

层通常学习类似的功能(权重共享)

如果暴露为API,我们可以偷一个模型来用吗?

可以的Y → 在这里解释了:http://www.cleverhans.io/2020/04/06/stealing-bert.html

当前蒸馏的最新进展是什么样的?

https://arxiv.org/pdf/2003.08271.pdf

更大的Transformer模型训练起来比小的更快?

更大的模型更快,见这篇文章:https://bair.berkeley.edu/blog/2020/03/05/compress/.

student-teacher框架的应用是什么?

Knowledge distillation用来产生更小的模型。

https://arxiv.org/pdf/1909.10351.pdf

对于不同的语言产生相似句子嵌入:https://arxiv.org/pdf/2004.09813v1.pdf

https://arxiv.org/pdf/2004.09813v1.pdf

如何设计模型?哪些是更重要的参数

这是一个很难回答的问题!所有这些都在“Scaling Laws for Neural Language Models”:https://arxiv.org/pdf/2001.08361.pdf中得到了解释

测试损失 Vs 计算

测试损失 Vs 数据集大小

测试损失 Vs 参数

要设计和训练一个模型,首先要确定架构。然后得到它的参数量。由此,你可以计算出损失。然后选择所需的数据大小和计算量。

看一下图中的比例方程。

Scaling Laws for Neural Language Models

最后…

我希望你们能像我一样通过这些问题学到很多东西。要成为更好的NLP工程师,我们需要对快速发展的迁移学习有更深的理解。我相信这些想法会让你忙上几周????????????

END

英文原文:

请长按或扫描二维码关注本公众号

喜欢的话,请给我个好看吧

标签组:[https] [pdf] [学习迁移] [nlp

本文来源:https://www.kandian5.com/articles/18687.html

相关阅读

怀孕期间阴道出现褐色分泌物,要尽快就医

阴道分泌物,一般指「白带」,正常呈白色或透明。在孕期出现褐色分泌物,一般是由阴道出血、宫腔胚胎异常或是胎盘异常出血等引起,由于分泌物在阴道停留时间长、排出较晚,就会变成褐色。妊娠期一般分为三个阶段,妊...

2025-10-31

胎梦暗示生女孩?专家拆解梦见小鸟、白色羽毛、晨露含义

自古以来,胎梦就被视为预测胎儿性别和未来发展的重要线索。许多准妈妈在怀孕期间会做各种奇特的梦,其中 梦见小鸟、白色羽毛和晨露 等意象尤为常见,且常被民间解读为可能预示生女孩的征兆。这些梦境究竟蕴含着怎...

2025-10-31

生女孩胎梦大全:梦见花卉、水果、水的预兆与解析!

从古至今,胎梦一直被准父母们视为预测宝宝性别与未来发展的重要线索。本文将深入解析梦见 花卉、水果、水 等常见意象与生女孩之间的神秘联系,为您提供一份详尽的胎梦指南。一、胎梦文化背景与科学认知胎梦,即...

2025-10-31

生女孩胎梦TOP10:月亮、雪花、紫藤花等吉祥梦境盘点

关于生女孩的胎梦,传统解读中往往与 柔和、纯净、优雅的意象 相关联。月亮代表阴柔之美,花朵象征生命的绽放,水元素寓意温柔如水,这些都在文化符号学中与女性特质紧密相连。而现代心理学则认为,这些梦境可能反...

2025-10-31

胎梦里的温柔暗示:梦见月亮、珍珠、蝴蝶大概率生女儿?

在东亚传统文化中,胎梦一直被视为预测胎儿性别和未来命运的重要征兆。当准妈妈们梦见 皎洁的月亮、晶莹的珍珠或翩翩的蝴蝶时,常常会听到"这可能是怀女孩的征兆"的说法。这些美丽而温柔的梦境意象,为何会与女孩...

2025-10-31

生女孩胎梦科学吗?心理学+民间说法双角度解析梦见蝴蝶

在备孕和怀孕期间,许多准父母都会经历各种奇妙的梦境,其中 "梦见蝴蝶" 常被认为与生女孩有关。这种关联不仅存在于中国民间传统中,在世界各地的文化里也有着丰富的解读。本文将从 心理学科学视角 和 民间传...

2025-10-31

生女孩胎梦VS生男孩胎梦:5大关键区别,你梦对了吗?

自古以来,胎梦就被视为预测胎儿性别和未来发展的重要征兆。许多准父母在怀孕期间都会经历各种生动奇特的梦境,这些梦境往往被赋予特殊的含义。在传统文化中, 生女孩和生男孩的胎梦有着显著的区别 ,从梦境内容到...

2025-10-31

社区医生:怀孕别养猫了,二手烟反倒没事!孕妇无语了

河南有一个孕妈妈怀孕五周去社区医院做阴道B超,确定自己有没有怀孕。当时夫妻俩想到怀孕了都非常关注,所以两夫妻都去医院了。而这个孕妈妈的老公有吸烟的习惯,她就希望能跟医生说一下,让老公戒烟,而且她家里面...

2025-10-31

男人抽烟对家庭伤害多大?老婆流产,女儿肺癌,儿子身高少10厘米

虽然每一包香烟上面都写着‘吸烟有害健康’,但是抽烟的人感受到的是烟可以带给他快乐。比如饭后抽一根烟就感觉自己像是神仙一样;比如说在困的时候抽一根烟能够解乏;比如说在无聊的时候抽...

2025-10-31

宝宝摔下床后,别急着立刻扶起来,了解"黄金十秒"很重要

广东中山一位宝妈面对孩子头朝下摔下床后的做法在短视频平台获得了众多网友的称赞。一是她没有慌乱;二是处理方法十分科学,连不少专家都留言夸赞“妈妈的做法让孩子受到的伤害降到最低”、...

2025-10-31