您的当前位置:首页 >IT科技类资讯 >无需深度学习框架,如何从零开始用Python构建神经网络 正文
时间:2025-11-04 21:04:31 来源:网络整理编辑:IT科技类资讯
动机:为了深入了解深度学习,我决定从零开始构建神经网络,并且不使用类似 Tensorflow 的深度学习库。我相信,对于任何有理想的数据科学家而言,理解神经网络内部的运作方式都非常重要。本文涵盖了我学
动机:为了深入了解深度学习,无需网络我决定从零开始构建神经网络,深度始用神经并且不使用类似 Tensorflow 的学习深度学习库。我相信,框架对于任何有理想的零开数据科学家而言,理解神经网络内部的构建运作方式都非常重要。
本文涵盖了我学到的无需网络所有东西,希望你也能从中获益!
一、深度始用神经什么是学习神经网络?
许多有关神经网络的介绍资料会将神经网络与大脑进行类比。但我发现,框架将神经网络简单地描述为一个从输入映射到输出的零开数学函数理解起来更容易。
神经网络由以下部分组成:
一个输入层,构建x 任意数量的无需网络隐藏层 一个输出层,ŷ 每两层之间都有一组权重和偏置,深度始用神经W 和 b 每个隐藏层都要选择一个激活函数 σ。学习在本文中,我们选用 Sigmoid 激活函数。下图展示了 2 层神经网络的结构(请注意,在计算神经网络层数的时候,通常不计入输入层)。

二层神经网络的结构
利用 Python 建立神经网络非常容易。
class NeuralNetwork: def __init__(self, x, y): self.input = x self.weights1 = np.random.rand(self.input.shape[1],4) self.weights2 = np.random.rand(4,1) self.y = y self.output = np.zeros(y.shape)1. 训练神经网络
一个简单 2 层神经网络的输出 ŷ 可以表示为:

你可能注意到,IT技术网在上面的等式当中,权重 W 和偏置 b 是影响输出 ŷ 的唯一变量。
自然,权重和偏差的正确值决定了预测的强度。根据输入数据微调权重和偏置的过程称为神经网络训练。
训练过程的每一次迭代包含以下步骤:
计算预测的输出 ŷ,称为前向传播 更新权重和偏置,称为反向传播以下流程图说明了这个过程:

2. 前向传播
正如我们在上图中所看到的,前向传播只是一个简单的计算。对于一个基本的 2 层神经网络,神经网络的输出计算如下:

我们可以在 Python 代码中添加一个前向传播函数来做到这一点。简单起见,我们假设偏置为 0。
class NeuralNetwork: def __init__(self, x, y): self.input = x self.weights1 = np.random.rand(self.input.shape[1],4) self.weights2 = np.random.rand(4,1) self.y = y self.output = np.zeros(self.y.shape) def feedforward(self): self.layer1 = sigmoid(np.dot(self.input, self.weights1)) self.output = sigmoid(np.dot(self.layer1, self.weights2))然而,我们仍然需要一种方法来评估我们的预测的「优秀程度」(即,我们的预测与真实值相差多少?)这就需要用到损失函数了。
3. 损失函数
损失函数有很多种,企商汇而我们问题的性质会决定我们使用哪种损失函数。在本文中,我们将采用简单的误差平方和。

误差平方和,即每个预测值和真实值之间差值的平均值。这个差值是取了平方项的,所以我们测量的是差值的绝对值。
在训练过程中,我们的目标是找到一组***的权重和偏置,使损失函数最小化。
4. 反向传播
现在,我们已经找到了预测误差的方法(损失函数),那么我们需要一种方法将错误「传播」回去,从而更新权重和偏置。
为了确定权重和偏置调整的适当值,我们需要知道损失函数对权重和偏置的偏导数。
从微积分的角度来看,函数的源码库偏导数也就是函数的斜率。

梯度下降算法
如果我们知道了偏导数,我们可以通过简单增加或减少偏导数(如上图所示)的方式来更新权重和偏置。这就是所谓的梯度下降。
然而,由于损失函数的方程不包含权重和偏置,所以我们不能直接计算损失函数对权重和偏置的偏导数。因此,我们需要链式法则来帮助计算。

以上是用于计算损失函数对权重偏导数的链式法则。简单起见,我们只展示了一层神经网络的偏导数。
唷!这看起来不大好看,但这能让我们获得所需——损失函数对权重的偏导数(斜率),以便相应调整权重。
既然我们已经有了链式法则公式,接下来我们把反向传播函数添加到 Python 代码中。
class NeuralNetwork: def __init__(self, x, y): self.input = x self.weights1 = np.random.rand(self.input.shape[1],4) self.weights2 = np.random.rand(4,1) self.y = y self.output = np.zeros(self.y.shape) def feedforward(self): self.layer1 = sigmoid(np.dot(self.input, self.weights1)) self.output = sigmoid(np.dot(self.layer1, self.weights2)) def backprop(self): # application of the chain rule to find derivative of the loss function with respect to weights2 and weights1 d_weights2 = np.dot(self.layer1.T, (2*(self.y - self.output) * sigmoid_derivative(self.output))) d_weights1 = np.dot(self.input.T, (np.dot(2*(self.y - self.output) * sigmoid_derivative(self.output), self.weights2.T) * sigmoid_derivative(self.layer1))) # update the weights with the derivative (slope) of the loss function self.weights1 += d_weights1 self.weights2 += d_weights2二、整合
既然我们已经有了做前向传播和反向传播的完整 Python 代码,我们可以将神经网络应用到一个示例中,看看它的效果。

我们的神经网络应该能够习得理想的权重集合以表示这个函数。请注意,对于我们来说,仅通过检查来计算权重并非一件小事。
如果我们将神经网络进行 1500 次迭代,看看会发生什么。下图展示了每次迭代的损失函数值,我们可以清晰地发现损失函数单调下降到最小值。这与我们前面讨论的梯度下降算法是一致的。

让我们看看神经网络在进行 1500 次迭代后的最终预测(输出):

进行 1500 次迭代后的预测值
我们成功了!我们的前向传播和反向传播算法成功训练了神经网络,且预测值收敛到了真实值。
请注意,预测值和真实值之间还是有一些轻微差异的。这是可取的,因为它防止了过度拟合,并且使得神经网络具有更强的泛化能力。
三、下一步
幸运的是,我们的探索还没有结束。关于神经网络和深度学习还有很多需要学习的地方。例如:
除了 Sigmoid 函数之外,我们还可以使用哪些激活函数? 在训练神经网络时使用学习率 使用卷积进行图像分类任务四、***一点想法
在撰写此文的过程中,我已经学到了很多,希望本文也能对你有所帮助。
在没有完全了解神经网络内部工作原理的情况下,虽然使用诸如 TensorFlow 和 Keras 之类的深度学习库可以让我们很容易地建立深度网络,但我认为对于有抱负的数据科学家而言,深入理解神经网络还是大有裨益的。
原文链接:
https://towardsdatascience.com/how-to-build-your-own-neural-network-from-scratch-in-python-68998a08e4f6
【本文是专栏机构“机器之心”的原创译文,微信公众号“机器之心( id: almosthuman2014)”】
戳这里,看该作者更多好文
惠普暗影精灵6新手教程(掌握惠普暗影精灵6,打造专业级游戏体验)2025-11-04 21:04
2024 年第一季度勒索软件态势2025-11-04 20:15
在Linux中安装Darkstat:基于网页的流量分析器2025-11-04 20:13
Linux系统下,如何以其他用户身份运行程序2025-11-04 19:59
惠普台式电脑拆解升级教程(一步步教你升级惠普台式电脑,让性能提升翻倍!)2025-11-04 19:56
重磅开源:高并发下缓存穿透、击穿、雪崩问题的解决方案!2025-11-04 19:47
选择优秀一致性级别:满足您的业务需求2025-11-04 19:47
医疗系统大事件:约三分之一的公民信息泄露2025-11-04 19:42
福克斯特电脑使用教程(轻松掌握福克斯特电脑操作技巧)2025-11-04 18:41
超详细的事务四大特性、隔离级别解读(带SQL语句)2025-11-04 18:19
电脑更新后出现错误,如何解决?(应对电脑更新错误的实用指南)2025-11-04 20:50
Redis类型(Type)与编码(Encoding)2025-11-04 19:46
SQL中的邮件配置!你学会了吗?2025-11-04 19:17
选择优秀一致性级别:满足您的业务需求2025-11-04 19:11
解决电脑启动风扇错误的方法(常见电脑风扇错误及其解决办法)2025-11-04 18:52
如何使用PowerShell更新Windows Defender2025-11-04 18:48
使用PandaSQL在Pandas中进行SQL查询2025-11-04 18:44
硬币都有两个面,而解决问题的时候总是有条件限制的2025-11-04 18:40
如何更换旧电脑的网卡(简单易懂的教程,轻松升级你的网络连接)2025-11-04 18:32
MongoDB从入门到精通、Springboot整合MongoDB2025-11-04 18:28