聊聊国内券商的大模型
LLaMA3是怎样炼成的-对齐篇
LLaMA3是怎样炼成的-基座篇
聊聊国内银行的大模型
Attention Is All You Need答疑解惑
大语言模型的参数高效微调:前缀微调
设置docker代理
这些日子
从GPT到LLaMA再到LLaMA2
简明GLM
BatchNorm和LayerNorm
让Google检索到你的博文
GPT4控制暖通空调
工业大模型COSMO-GPT
大语言模型的参数高效微调:软提示
大模型的温度
不走运的人
纪念汤晓鸥
多语言预训练模型-XLM和XLM-R
多语言预训练模型-Multilingual BERT
盐帮古道徒步
安山古道徒步
立秋了
大语言模型的参数高效微调:低秩适配
大语言模型的参数高效微调:适配器方法
七色光
法老之蛇
制备二氧化碳
电生磁
拆开电子门锁
拆开爸爸的电动剃须刀
BERT模型有多少参数?
在WSL2上安装CUDA和Pytorch
由陈皓去世所想到的
教师节楹联
文化金徽行二首
过长安访友
江阴赠别二首
subscribe via RSS