Code Your Own LLM

动手训练你自己的大语言模型 [⚠️ Alpha内测版]

这是一份全栈式的参考指南，用最简洁的代码帮助你端到端定义大语言模型的每一个细节

📖 项目简介

Code Your Own LLM 是一个基于 nanochat 的深度扩展项目，旨在提供一份从原理到实践、从算法到工程的全栈式大语言模型参考指南。我们将提供最简洁的代码实现，没有复杂封装、层层继承和不必要的抽象，用极致的扁平化结构，零层级嵌套和极简的项目依赖来实现大语言模型从零训练到工程落地的整套流程。此外，项目补充了深入的算法原理讲解、详细的复现教程、前沿的优化技术分析，以及丰富的可视化交互。

我们希望从原理解读、工程实现、实践指导、优化分析、可视化展示五个维度，系统且详尽地诠释大语言模型算法及工程中从理论设计到代码实现的每一个细节。帮助学习者踏入大语言模型的美妙世界。通过本项目的学习，你将有能力定义独属于自己的大语言模型，能够理解每一行代码背后的数学原理与工程考量，能够根据实际需求调整模型架构与训练策略。

项目当前处于⚠️ Alpha内测版本，尚不完整且可能存在错误。

📚 结构预览

章节	摘要	状态
第1章引言	项目概述以及学习建议	✅
第2章环境配置	开发环境搭建与硬件要求解析	✅
第3章数据	数据采集、清洗及质量评估	✅
第4章分词	分词算法原理与词表构建实践	🚧
第5章模型架构	从零实现模型核心架构	✅
第6章预训练	大规模预训练的目标与优化策略	🚧
第7章中期训练	领域适应与持续学习技术	🚧
第8章有监督微调	指令微调与参数高效微调方法	✅
第9章强化学习	强化学习与模型偏好对齐	✅
第10章模型推理	高效推理与量化加速技术	🚧
第11章模型评估	评估指标体系与基准测试方法	🚧
第12章模型安全与红队测试	安全对齐与红队测试实践	🚧
附录	数学基础与前沿论文解读	🚧

🤝 项目成员

感谢以下项目的核心贡献者，排名不分先后

🙏致谢

本项目受益于 nanochat, nanoGPT, transformers, pytorch, llms-from-scratch 感谢以上开源项目的出色工作！

📜 开源协议

项目采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

Name		Name	Last commit message	Last commit date
Latest commit History 58 Commits
assets		assets
code		code
docs		docs
.gitignore		.gitignore
AGENTS.md		AGENTS.md
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Code Your Own LLM

动手训练你自己的大语言模型 [⚠️ Alpha内测版]

📖 项目简介

📚 结构预览

🤝 项目成员

🙏致谢

📜 开源协议

About

Uh oh!

Releases

Packages

Contributors 3

Uh oh!

License

datawhalechina/code-your-own-llm

Folders and files

Latest commit

History

Repository files navigation

Code Your Own LLM

动手训练你自己的大语言模型 [⚠️ Alpha内测版]

📖 项目简介

📚 结构预览

🤝 项目成员

🙏致谢

📜 开源协议

About

Topics

Resources

License

Code of conduct

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Uh oh!

Packages