vgoklani

Vishal Goklani vgoklani

Interested in Deep Learning (self-supervised learning & LLMs), Astrophysics (exoplanets), and Cosmology (CMB).... I like to build things

Pinned Loading

pytorch/pytorch pytorch/pytorch Public

Tensors and Dynamic neural networks in Python with strong GPU acceleration

Python 87k 23.4k
NVIDIA/TransformerEngine NVIDIA/TransformerEngine Public

A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit floating point (FP8) precision on Hopper and Ada GPUs, to provide better performance with lower memory utilizatio…

Python 2.2k 363
RedisTimeSeries/RedisTimeSeries RedisTimeSeries/RedisTimeSeries Public

Time Series data structure for Redis

C 1k 145
IST-DASLab/gptq IST-DASLab/gptq Public

Code for the ICLR 2023 paper "GPTQ: Accurate Post-training Quantization of Generative Pretrained Transformers".

Python 2k 164
fpgaminer/GPTQ-triton fpgaminer/GPTQ-triton Public

GPTQ inference Triton kernel

Jupyter Notebook 295 22
Dao-AILab/flash-attention Dao-AILab/flash-attention Public

Fast and memory-efficient exact attention

Python 15.5k 1.5k