[llms] Docs

less than 1 minute read

Published:

个人向学习文档

基础部分和面试问题:

1. happy魇:研一基本功【注意力+diffusion+大模型微调】

相关文档(飞书)

科普:通俗易懂理解全量微调和LoRA微调

李沐:论文精读系列

月球大叔:vllm源码讲解

啦啦小黄瓜:ComfyUI:FLUX+Lora 本地模型

LearnToCompress:李宏毅课程搬运

以往的月:Qwen3-开源SOTA的大语言模型系列

大模型微调实战

unsloth

2. 堂吉柯德:【DeepSeek+LoRA+FastAPI】开发人员如何微调大模型并暴露接口给后端调用

Demo前端Github地址:https://github.com/huangyf2013320506/magic_conch_frontend.git

Demo后端Github地址(含数据集):https://github.com/huangyf2013320506/magic_conch_backend.git

笔记文档(.md):https://pan.quark.cn/s/57939e67d3d0

笔记文档(.pdf):https://pan.quark.cn/s/d5ed78ef4f76

所有资料:https://pan.quark.cn/s/802cd0c232b4

3. RethinkFun:大模型微调,DeepSeek技术原理

代码

code秘密花园:如何把你的 DeePseek-R1 微调为某个领域的专家?(实战篇)

代码

DeepSeek-V3(包含 model, generate 写法)

基本所有模型

labml 常用模型实现

LoRA

vllm

https://blog.vllm.ai/2023/06/20/vllm.html https://github.com/LMCache/LMCache

强化学习入门

五道口纳什:强化学习入门,数学原理

代码