如何理解 RNN ?LSTM 又是啥?

✦ AI 摘要

用通俗类比解释了 RNN 的工作原理及其梯度消失问题,并通过数学公式详细说明 LSTM 的门控机制如何实现长期记忆。

九月 20, 2024 · 2 分钟

如何理解交叉熵?

✦ AI 摘要

用猜糖果颜色的直观类比解释交叉熵的概念,配以公式推导和逐步数值计算示例,阐明其作为深度学习分类任务损失函数的核心作用。

九月 18, 2024 · 1 分钟

如何理解嵌入层

✦ AI 摘要

用学生姓名分配特征的类比,生动解释嵌入层如何将离散数据转换为有语义含义的数值向量,并结合 NLP 词嵌入实例深化理解。

九月 13, 2024 · 1 分钟

Andrej Karpathy 的 Neural Networks: Zero to Hero 系列视频笔记:2 - Makemore

✦ AI 摘要

Andrej Karpathy《Zero to Hero》系列第二讲的学习笔记,记录了从二元字符模型到神经网络语言模型的构建过程,深入理解字符级序列生成的核心思路。

九月 12, 2024 · 21 分钟

Andrej Karpathy 的 Neural Networks: Zero to Hero 系列视频笔记:1 - Micrograd

✦ AI 摘要

Andrej Karpathy《Zero to Hero》系列第一讲的学习笔记,通过从零构建 Micrograd,深入理解反向传播算法与自动微分的本质原理。

九月 11, 2024 · 21 分钟