zijiexia

Follow

🎯

Focusing

zijiexia

🎯

Focusing

Follow

Continuous learning is the only defensible moat.

2 followers · 17 following

CA

Achievements

Achievements

zijiexia/README.md

Hi there 👋

Pinned Loading

THUDM/slime THUDM/slime Public

slime is an LLM post-training framework for RL Scaling.

Python 3.4k 421
radixark/miles radixark/miles Public

Miles is an enterprise-facing reinforcement learning framework for large-scale MoE post-training and production workloads, forked from and co-evolving with slime.

Python 725 76
language-model-from-scratch language-model-from-scratch Public

Build a GPT like language model from scratch

Python
FlashAttention-2-Triton FlashAttention-2-Triton Public

Simplified FlashAttention-2 Triton Implementation

Python