relu激活函数从ReLU到GELU 一文概览神经网络的激活函数

栏目：科技 2021-09-17 07:20:22

分享到:

从mlfromscratch中选择

机器心脏编译

参与:杜威熊猫

激活函数对神经网络的重要性不用多说，机器心已经发表了一些相关的介绍文章，如《深度学习中的激活函数概述》。本文还重点讨论了激活函数。来自数据传输单元的Casper Hansen通过公式、图表和代码实验介绍了sigmoid、ReLU、eLU和更新的Leaky ReLU、SELU和GELU激活函数，并比较了它们的优缺点。

在计算每一层的激活值时，我们需要使用激活函数，然后我们就可以确定这些激活值是什么。根据每层之前的激活、权重和偏移量，我们需要为下一层的每次激活计算一个值。但是在将值发送到下一层之前，我们需要使用激活函数来缩放输出。本文将介绍不同的激活函数。

在阅读这篇文章之前，你可以阅读我之前的一篇关于神经网络中的前向传播和后向传播的文章，其中简单提到了激活函数，但是并没有介绍它实际上是做什么的。本文的内容将基于上一篇文章的知识。

上一篇文章的地址:https://mlfromscratch.com/neural-networks-explained/

卡斯帕·汉森

总结

什么是sigmoid函数？

梯度问题:反向传播

梯度消失问题

梯度爆炸问题

梯度爆炸的极端情况

避免渐变爆炸:渐变裁剪/范数

整流线性单元

死亡ReLU:优点和缺点

指数线性元素

泄漏整流器线性单元

扩展指数线性元素

SELU:正常化的特例

重量初始化+脱落

高斯误差线性元素

代码:深度神经网络超参数搜索

cf白狼又一经典帅气男角色焕发新生白狼—X你值得拥有

你好，我的朋友们！我是你的令狐妹~最近，相信大家最关注的就是4月推出的新版提前服务了。这个新版本的规模不亚于2021年的上一个大版本。无尽挑战模式第三季正式开启，多人生化模式更新新画面。此外，武器道具中还有很多英雄级

·21-09-17
红白歌会 2020红白歌会最全观看攻略

当当当当！！今天！今天！今天是第71届红白歌会！今年NHK歌会已经是第71次举办了，每年12月31日播出，可以理解为日本的春晚。对于一个歌手来说，能登上红白歌会的舞台是莫大的荣幸！每年，NHK都会邀请大约40组艺

·21-09-17
虞书欣副乳虞书欣喊话记者帮忙修副乳网友直呼太敢说了好真实

以斯帖·余喊记者帮忙修副胸，网友喊得太敢说了，这么真实最近，俞敏洪参加了一个时尚活动。在现场，她俏皮地对摄影师喊道:“这是我一年来第一次光着膀子穿衣服，到时候我的记者朋友都会有乳房什么的，帮我修修吧。”"有特制的

·21-09-17
深静脉穿刺国家卫健委发布静脉采血最新标准医护必看

导言: 静脉血采集国家标准，快速采集~ 采血前患者的准备第一，饮食患者在采血前不应改变饮食习惯，24小时内不应饮酒。需要空腹部采血的检测项目包括: ●葡萄糖代谢:空腹部血糖、空腹部胰岛素、空腹部C肽等。 ●血脂:总

·21-09-17
福州学生街一组福州学生街老照片带回学生时代的记忆

福州学生街，又称史明学院街，位于福建师范大学仓山校区旁。20世纪80年代已经初具规模。20世纪90年代，高校扩招导致学生街附近的高校学生数

·21-09-17
张令仪演员八大艺人经纪公司大PK 明星幕后的推手都有谁

文字/云西月国内有数十家艺人经纪公司，知名艺人经纪管理机构实施了包括“经理人+经纪人”艺人管理模式、扁平化管理模式、定制化服务模式、平台创新模式、见习明星培养模式、艺人梯队进阶模式、高校毕业生签约培养模

·21-09-17
女友的妹妹深夜，女友妹妹穿睡衣，偷偷跑进了我的房间，她的行为让我脸红

大家好，我叫小航。今年26岁。女友比我小2岁。我们在一起2年多了。是在一次朋友的生日聚会上认识的。那时候，她给我的第一印象就是她是一个特别单纯的女孩。而且是那种体贴温柔的类型。经过试探得知她没有男朋友之后，我对

·21-09-17
长株潭城轨网上订票长株潭城轨西环线一期湘潭段高架桥全线贯通

7月21日，长株潭城际轨道交通西环线一期工程湘潭段高架桥已完工，车站建设进展顺利。项目起于沪昆高铁湘潭北站，止于长沙地铁3号线山塘站，全长17.29公里。按照“一车一轨”的原则，一期工程与长沙地铁3号线融为一体，

·21-09-17

relu激活函数 从ReLU到GELU 一文概览神经网络的激活函数

relu激活函数从ReLU到GELU 一文概览神经网络的激活函数