IIWAB
博客
×
请登录
账号
密码
登录 Use it
博客
随笔
分享
标签
登录
`nn` 多种损失函数对比
损失函数数学公式用途特性 nn.MSELoss( \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 )回归问题,如预测房价、股票价格等。对异常值敏感,会放大预测值和真实值之...
IIWAB
博客
1月前
95
0
`nn.init` 多种权重初始化方法
初始化方法函数名原理适用场景优点缺点 零初始化nn.init.zeros_将所有的权重参数初始化为零不适用(极少情况)简单易实现会导致所有神经元学习到相同的特征,造成对称问题,模型无法收敛 随机初始化nn.init.uniform_在指定的均...
IIWAB
博客
1月前
75
0
transformer中的encoder,decoder, cross attention, self attention
在Transformer架构里,Encoder、Decoder、Cross Attention和Self Attention是关键组件, 1. Self Attention Self Attention是Transformer的核心机制,它能够让...
IIWAB
博客
2月前
116
0
rnn与cnn区别
RNN与CNN的主要区别体现在应用领域、网络结构、数据处理方式、擅长任务类型及训练挑战五个方面。CNN适用于图像等空间数据,而RNN更适合时间序列或文本等序列数据。 一、应用领域差异 CNN的核心应用是计算机视觉领域,例如图像分类、目标检测等。其...
IIWAB
博客
2月前
88
0
动量 warmup 梯度下降 学习率
动量(Momentum):在物理学中,动量是物体质量与速度的乘积,是一个矢量。在机器学习和深度学习的优化算法中,动量是一种常用的技术,模拟了物体运动时的惯性。以随机梯度下降(SGD)算法为例,加入动量后,每次更新参数时不仅考虑当前的梯度,还会考虑...
IIWAB
博客
2月前
110
0
在 Windows 系统上使用 Docker 部署 Milvus
在 Windows 系统上使用 Docker 部署 Milvus 可以按照以下步骤进行: 安装 Docker Desktop for Windows 确保的 Windows 系统满足 Docker Desktop 的要求(例如 Window...
IIWAB
博客
2月前
141
0
Conda 环境的基本命令
Conda 是一个强大的包和环境管理工具,常用于管理 Python 环境。以下是一些 Conda 环境的基本命令: 1. 创建新环境 conda create --name <环境名称> python=<Python版本>...
IIWAB
博客
2月前
124
0
WSL distro 登录失败: 未授予用户在此计算机上的请求
1. 解决方法 打开powershell执行 wsl --shutdown gpupdate /force 2. 为什么 gpupdate /force命令在Windows系统中用于强制刷新组策略设置。 这个命令会立即应用所有新的或更改过...
IIWAB
博客
2月前
98
0
Resource punkt_tab not found.
Resource punkt_tab not found. Please use the NLTK Downloader to obtain the resource: import nltk nltk.download('punkt_ta...
IIWAB
博客
2月前
110
0
LangChain的6个模块
1. Model I/O 功能 该模块负责与各类语言模型进行交互,可向模型发送输入提示并接收输出。它支持多种语言模型,像OpenAI的GPT系列、Hugging Face上的模型等。 样例 以下代码展示了如何使用Model I/O模块调用Open...
IIWAB
博客
2月前
138
0
1
2
3
4
...
20
热门文章
1.
CentOS 7 安装Maven
2.
docker-compose安装elk7.1.1版本
3.
MySQL创建数据库与创建用户以及授权
4.
SpringCloud网关修改请求头使微服务获取客户端真实ip
5.
Zookeeper 3.5启动时 8080端口被占用
6.
docker-compose相关配置项
最新发布
1.
VAE(变分自编码器)、GAN(生成对抗网络)和Diffusion(扩散模型)
2.
API、Function Call、MCP、MoE、MoA、Agent与多智能体
3.
pgsql 执行delete语句后, 磁盘空间什么时候回收
4.
大模型的位置编码
5.
ChatGPT强化学习
6.
语言模型的评估指标
最新评论