nanoeuler
GitHub - JustVugg/nanoeuler: GPT-2-style LLM built from scratch in C/CUDA with hand-written backprop, BPE tokenizer, FlashAttention, pretraining, and SFT.
C/CUDA로 밑바닥부터 직접 구현한 GPT-2 스타일의 소형 언어 모델입니다. 외부 라이브러리 없이 수작업으로 작성된 역전파, 토크나이저, FlashAttention을 포함한 학습 파이프라인을 제공합니다.
가격 정책: Open Source