今日看点

你对NLP的迁移学习爱的有多深?21个问题弄懂最新的NLP进展。

发表于话题:512的暗示
发布时间:2021-05-21

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”

作者:Pratik Bhavsar

编译:ronghuaiyang

导读

如果这21个问题你全部了解的话,你对最新的NLP进展的了解已经过关了。

2018年10月BERT发布之后发生了很多事情。

你知道BERT的掩码语言模型是老派模型吗?

你知道注意力的计算不需要平方时间复杂度吗?

你知道你可以偷用谷歌的模型吗?

我们这一代人中一些最聪明的人一直在紧张地工作,并有大量的产出!NLP现在是最性感的领域????

NLProc已经走了很长的路。

我们需要另一个总结!!

这20个问题会测试你对NLP当前状态的更新程度的了解,并为任何技术讨论做好准备。

什么是最新的预训练模型(PTM)?

https://arxiv.org/pdf/2003.08271.pdf

PTMs的训练任务是什么?

https://arxiv.org/pdf/2003.08271.pdf

在GLUE上,最好的PTMs是什么?

https://arxiv.org/pdf/2003.08271.pdf

更多的数据是不是总是可以得到更好的语言模型?

T5论文说不是的,质量比数量更重要。

https://arxiv.org/pdf/1910.10683.pdf

什么tokenisation方法对于训练语言模型是最好的?

这篇文章:https://arxiv.org/pdf/2004.03720.pdf,说一种新的方法Unigram LM要比BPE和WordPiece更好一些。

训练语言模型的最好的任务是什么

目前最好的方法是ELECTRA→在生成器的帮助下替换输入token,然后使用识别器来预测哪个token被替换了。

https://arxiv.org/pdf/2003.10555.pdf

https://arxiv.org/pdf/2003.10555.pdf

Also T5论文还说, dropping a span为3是最好的。

https://arxiv.org/pdf/1910.10683.pdf

Transformer训练的时候是否需要逐步的解冻参数?

T5 论文说不需要。

https://arxiv.org/pdf/1910.10683.pdf

如果你有固定的训练预算,你会通过改变什么来得到更好的语言模型?

T5 paper建议同时提升训练的步数和模型的大小。

https://arxiv.org/pdf/1910.10683.pdf

如果你的序列长度超过了512,你会用什么模型?

Transformer-XL或者Longformer

Transformer的处理时间随着序列的长度是怎么扩展的?

平方扩展。

如何降低长文档的transformers处理时间,因为它是序列长度的二次函数?

Longformer使用了一种随着序列长度线性扩展的注意力机制。

https://arxiv.org/pdf/2004.05150.pdf

Longformer在语义搜索中对编码长文档非常有用。下表显示了到目前为止所做的工作。

https://arxiv.org/pdf/2004.05150.pdf

BERT表现这么好是因为注意力层吗?

论文Attention is not Explanation认为注意力没有正确地与输出相关,因此我们不能说由于注意机制,模型的表现更好。

如果我们去掉一个注意力头,BERT的表现会下降很多吗?

不会 —见论文 Revealing the Dark Secrets of BERT

如果我们去掉一层,BERT的表现会下降很多吗?

不会 —见论文 Revealing the Dark Secrets of BERT

如果我们随机初始化BERT,BERT的表现会下降很多吗

不会 —见论文 Revealing the Dark Secrets of BERT

我们真的需要模型压缩吗?

也许不是!这篇文章的笔记:http://mitchgordon.me/machine/learning/2020/01/13/do-we-really-need-model-compression.html。

“模型压缩技术通过解释过度参数化模型趋向于收敛的结果类型,给我们一个关于如何训练适当参数化模型的提示。模型压缩有很多种类型,每一种都利用了一种不同类型的“简单性”,这种“简单性”通常在训练过的神经网络中可以找到:

许多权重接近于零(修剪)

权重矩阵是低秩的(权重分解)

权重能只用几个位表示(量化)

层通常学习类似的功能(权重共享)

如果暴露为API,我们可以偷一个模型来用吗?

可以的Y → 在这里解释了:http://www.cleverhans.io/2020/04/06/stealing-bert.html

当前蒸馏的最新进展是什么样的?

https://arxiv.org/pdf/2003.08271.pdf

更大的Transformer模型训练起来比小的更快?

更大的模型更快,见这篇文章:https://bair.berkeley.edu/blog/2020/03/05/compress/.

student-teacher框架的应用是什么?

Knowledge distillation用来产生更小的模型。

https://arxiv.org/pdf/1909.10351.pdf

对于不同的语言产生相似句子嵌入:https://arxiv.org/pdf/2004.09813v1.pdf

https://arxiv.org/pdf/2004.09813v1.pdf

如何设计模型?哪些是更重要的参数

这是一个很难回答的问题!所有这些都在“Scaling Laws for Neural Language Models”:https://arxiv.org/pdf/2001.08361.pdf中得到了解释

测试损失 Vs 计算

测试损失 Vs 数据集大小

测试损失 Vs 参数

要设计和训练一个模型,首先要确定架构。然后得到它的参数量。由此,你可以计算出损失。然后选择所需的数据大小和计算量。

看一下图中的比例方程。

Scaling Laws for Neural Language Models

最后…

我希望你们能像我一样通过这些问题学到很多东西。要成为更好的NLP工程师,我们需要对快速发展的迁移学习有更深的理解。我相信这些想法会让你忙上几周????????????

END

英文原文:

请长按或扫描二维码关注本公众号

喜欢的话,请给我个好看吧

标签组:[https] [pdf] [学习迁移] [nlp

本文来源:https://www.kandian5.com/articles/18687.html

相关阅读

Mate70要首发!消息称新麒麟CPU已调试很好:跑分有望突破110万

快科技5月6日消息,有博主爆料称,华为的新麒麟CPU已调试很好,跑分有望突破110万。 按照这位博主的说法,目前新麒麟处理器进展很顺利,如果不出意外,那么Mate 70或将首发(预计是10月份)。 在...

2024-05-06

意外参演《西游记》,被称作“渣女人设颜值天花板”,身家过亿的她,如今只爱演大妈?

夕阳透过玻璃窗,斜射进会议室。 一位长相清秀的姑娘,坐在窗前。 金色的余晖,将姑娘洁白红润的脸庞,映衬得像小麦一样饱满而健康。 散发出的轮廓,宛如一幅中世纪少女的油画。 见到这一幕,化妆师张兴华不禁感...

2024-05-06

韩剧崩溃是谁演的 崩溃的凶手

  1、韩剧《崩溃》是李民基、郭善英、许成泰、李浩哲、文姬主演的,这部剧英文名《crash》,是偏喜剧风格的犯罪调查电视剧。2、《崩溃》中李民基饰演车延浩一角,出身韩国科学技术院,郭善英饰演冷静又感性...

2024-05-06

赵薇股权再遭冻结,原来她做的“丑事”,远比你想象得更恶劣

在娱乐圈和商业圈的风云变幻中,赵薇的名字曾一度是风光无限的象征。 然而,近年来,这位昔日的女神却频频陷入风波,其股权屡次被冻结,背后的原因更是令人咋舌。原来,赵薇所干的“丑事”,远比我们想象的要恶劣得...

2024-05-06

请和这样的我恋爱吧和绅士的品格什么关系 请和这样的我恋爱电视剧

  1、《请和这样的我恋爱吧》是翻拍自《绅士的品格》,所以剧情和人物角色的设定都跟《绅士的品格》很像。2、《请和这样的我恋爱吧》由胡一天、梁洁、代旭等人主演,而《绅士的品格》是张东健、金秀路、金荷娜等...

2024-05-06

她被称为“大陆第一美人”,两大名导为其着迷,今55岁活得像25岁

在影视的星河中,总有那么几颗璀璨的星星,她们以独特的光芒照亮了整个天空。其中,汪子璇便是那最为耀眼的一颗,被誉为“大陆第一美人”。 她以绝世的容颜和卓越的演技,征服了无数观众的心,让两位大导演为之倾倒...

2024-05-06

请和这样的我恋爱吧更新日历是什么 请和这样的我恋爱吧什么时候播上映

  1、《请和这样的我恋爱吧》自5月3日开始首播,爱奇艺和腾讯会员首日更新六集,每天18点更新两集。2、《请和这样的我恋爱吧》翻拍自经典韩剧《绅士的品格》,由胡一天、梁洁、代旭等人主演。3、这是一部讲...

2024-05-06

巨鹿之战的胜利者:项羽如何一战成名

在中国历史上,有许多战役因其规模宏大、影响深远而被世人铭记。其中,秦末时期的巨鹿之战无疑是一个经典战例。这场战役中,西楚霸王项羽率领的楚军取得了辉煌的胜利,一举改变了秦朝的命运。那么,项羽是如何在巨鹿...

2024-05-06

又美又能打:国乒21岁第一美女,气质如袁咏仪,曾是孙颖莎陪练

在国乒的璀璨星空中,有一位年轻的女将如流星般耀眼,她就是王添艺。 这位年仅21岁的乒乓女神,不仅拥有如袁咏仪般的气质和美貌,更在乒乓球场上展现了非凡的实力。她曾是孙颖莎的陪练,如今已崭露头角,成为国乒...

2024-05-06

请和这样的我恋爱吧一共多少集 请和这样的我恋爱吧免费观看完整版

  1、《请和这样的我恋爱吧》一共有四十集,该剧自5月3日开始在爱奇艺播出,每天更新两集。2、《请和这样的我恋爱吧》围绕着四对男女的爱情、事业等展开讲述故事,其中胡一天饰演的叶晗和梁洁饰演的李潇潇是一...

2024-05-06