大语言模型 - AI学习

探索大语言模型的世界，记录从理论到实践的学习历程，分享模型训练、微调、部署的经验。

自注意力机制编码解码

深入理解Transformer架构的核心原理，学习自注意力机制、位置编码等关键技术。

GPT-3 GPT-4

研究GPT系列模型的发展历程，学习其架构设计、训练方法和应用场景。

LLaMA ChatGLM

实践LLaMA、ChatGLM等开源大模型，学习本地部署、微调方法和应用开发。

LoRA P-tuning

学习大模型微调技术，掌握LoRA、P-tuning等高效微调方法，定制专属模型。

Prompt设计 Few-shot

掌握提示工程的艺术，学习如何设计有效的Prompt，提升模型输出质量。

LangChain RAG

使用LangChain等框架开发大模型应用，学习RAG、Agent等前沿应用模式。

📝大语言模型