IIWAB
IIWAB
×
请登录
账号
密码
登录 Use it
博客
随笔
分享
标签
登录
大模型的位置编码
绝对位置编码 原理:为每个位置赋予一个唯一的编码向量,该向量与输入序列中的元素相结合,使模型能够区分不同位置的元素。例如,在正弦位置编码中,通过正弦和余弦函数计算不同位置的编码值。 优点 位置信息明确:能直接且明确地将每个位置的绝对信息传递给...
IIWAB
博客
4月前
220
0
ChatGPT强化学习
ChatGPT强化学习主要包括以下步骤,涉及SFT模型、RM模型及PPO算法: 带监督的微调(SFT模型): 数据收集:选择一份提示列表,让一组人工标注人员写下预期的输出响应。提示来源包括标注人员或开发人员直接提供,以及从OpenAI的API...
IIWAB
博客
4月前
246
0
语言模型的评估指标
基于生成文本的指标 困惑度(Perplexity) 原理:衡量语言模型对给定文本序列的预测能力,是对模型预测概率的几何平均倒数。困惑度越低,说明模型对文本的预测越准确,语言理解和生成能力越强。 1})的情况下预测单词(w_{i})的概率。 ...
IIWAB
博客
4月前
243
0
语言模型的发展阶段
语言模型的发展主要经历了以下四个阶段: 统计语言模型阶段:20世纪90年代,统计语言模型成为自然语言处理的主要技术。其核心思想是基于马尔可夫假设,通过统计语言序列中词与词之间的频率关系来预测下一个词的出现概率,通常使用固定长度的上下文窗口,如二...
IIWAB
博客
4月前
243
0
unigram、bigram、trigram 以及 n-gram
Unigram(一元模型) 定义:单个的词语或者符号。 示例:在句子“我爱自然语言处理”里,unigram 有“我”“爱”“自然”“语言”“处理”。 用途:可用于词频统计,像构建词袋模型就会用到。 Bigram(二元模型) 定义:由两个...
IIWAB
博客
4月前
288
0
pytorch中多种梯度下降优化算法的比较
在PyTorch中,常见的梯度下降优化算法有多种: 随机梯度下降(SGD) 原理:每次使用一个样本进行梯度计算和参数更新。 优点:计算速度快,能够处理大规模数据集,容易实现。 缺点:梯度估计方差较大,导致收敛过程可能会有较大波动,有时需要较长时...
IIWAB
博客
4月前
264
0
批量梯度下降(BGD)、随机梯度下降(SGD)和小批量梯度下降(Mini - Batch GD)
计算方式 批量梯度下降(BGD):每次更新参数时都使用整个训练数据集来计算梯度。具体来说,对于具有(m)个样本的训练集,其梯度计算是对所有样本的损失函数关于参数的偏导数求和,然后再根据梯度更新参数。 随机梯度下降(SGD):每次更新参数时只使用...
IIWAB
博客
4月前
206
0
`nn` 多种损失函数对比
损失函数数学公式用途特性 nn.MSELoss( \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 )回归问题,如预测房价、股票价格等。对异常值敏感,会放大预测值和真实值之...
IIWAB
博客
4月前
181
0
`nn.init` 多种权重初始化方法
初始化方法函数名原理适用场景优点缺点 零初始化nn.init.zeros_将所有的权重参数初始化为零不适用(极少情况)简单易实现会导致所有神经元学习到相同的特征,造成对称问题,模型无法收敛 随机初始化nn.init.uniform_在指定的均...
IIWAB
博客
4月前
173
0
transformer中的encoder,decoder, cross attention, self attention
在Transformer架构里,Encoder、Decoder、Cross Attention和Self Attention是关键组件, 1. Self Attention Self Attention是Transformer的核心机制,它能够让...
IIWAB
博客
5月前
190
0
1
2
3
4
...
22
热门文章
1.
CentOS 7 安装Maven
2.
docker-compose安装elk7.1.1版本
3.
MySQL创建数据库与创建用户以及授权
4.
SpringCloud网关修改请求头使微服务获取客户端真实ip
5.
Zookeeper 3.5启动时 8080端口被占用
6.
docker-compose相关配置项
最新发布
1.
dubbo 集群容错策略,为什么选择failover做默认
2.
微服务监控要素
3.
Apollo, Nacos特性
4.
MYSQL8.0 新特性
5.
MySQL实战:高效查询每个用户最近购买的3件商品
6.
springboot 的application.yml文件读取pom文件的properties属性
最新评论