← 返回首页

📝大语言模型

探索大语言模型的世界,记录从理论到实践的学习历程,分享模型训练、微调、部署的经验。

Transformer架构

自注意力机制 编码解码

深入理解Transformer架构的核心原理,学习自注意力机制、位置编码等关键技术。

阅读更多

GPT系列模型

GPT-3 GPT-4

研究GPT系列模型的发展历程,学习其架构设计、训练方法和应用场景。

阅读更多

开源大模型实践

LLaMA ChatGLM

实践LLaMA、ChatGLM等开源大模型,学习本地部署、微调方法和应用开发。

阅读更多

模型微调技术

LoRA P-tuning

学习大模型微调技术,掌握LoRA、P-tuning等高效微调方法,定制专属模型。

阅读更多

提示工程

Prompt设计 Few-shot

掌握提示工程的艺术,学习如何设计有效的Prompt,提升模型输出质量。

阅读更多

大模型应用开发

LangChain RAG

使用LangChain等框架开发大模型应用,学习RAG、Agent等前沿应用模式。

阅读更多

记录技术成长,分享学习心得 | 持续更新中...