Krishna Teja Chitty-Venkata's picture

Building on HF

Krishna Teja Chitty-Venkata

krishnateja95

RedHatAI

·

https://krishnateja95.github.io/

AI & ML interests

LLM Optimization, Neural Architecture Search, Quantization, Pruning

Recent Activity

updated a model 8 days ago

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-FP8-dynamic

updated a model 8 days ago

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-FP8-block

updated a model 8 days ago

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-quantized.w4a16

View all activity

Organizations

updated 3 models 8 days ago

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-FP8-dynamic

Text Generation • 561B • Updated 5 days ago • 1.17k • 1

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-FP8-block

Text Generation • 561B • Updated 5 days ago • 873

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-quantized.w4a16

Text Generation • 565B • Updated 5 days ago • 890 • 3

published 3 models 9 days ago

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-quantized.w4a16

Text Generation • 565B • Updated 5 days ago • 890 • 3

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-FP8-block

Text Generation • 561B • Updated 5 days ago • 873

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-FP8-dynamic

Text Generation • 561B • Updated 5 days ago • 1.17k • 1

updated a bucket 10 days ago

krishnateja95/Mellum2-12B-A2.5B-Thinking

published a bucket 10 days ago

krishnateja95/Mellum2-12B-A2.5B-Thinking

updated a model 17 days ago

RedHatAI/NVIDIA-Nemotron-3-Super-120B-A12B-BF16

Text Generation • 124B • Updated 17 days ago • 2.14k

updated 11 models 24 days ago

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-noise

Image-Text-to-Text • 32B • Updated 24 days ago • 63

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-hybrid

Image-Text-to-Text • 32B • Updated 24 days ago • 64

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-heuristic

Image-Text-to-Text • 32B • Updated 24 days ago • 115

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-noise

Image-Text-to-Text • 30B • Updated 24 days ago • 77

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-hybrid

Image-Text-to-Text • 30B • Updated 24 days ago • 62

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-heuristic

Image-Text-to-Text • 30B • Updated 24 days ago • 82

inference-optimization/Qwen3.6-35B-A3B-6.0-bits-mode-noise

Image-Text-to-Text • 28B • Updated 24 days ago • 46

inference-optimization/Qwen3.6-35B-A3B-6.0-bits-mode-hybrid

Image-Text-to-Text • 28B • Updated 24 days ago • 130

inference-optimization/Qwen3.6-35B-A3B-6.0-bits-mode-heuristic

Image-Text-to-Text • 28B • Updated 24 days ago • 68

inference-optimization/Qwen3.6-35B-A3B-5.5-bits-mode-noise

Image-Text-to-Text • 26B • Updated 24 days ago • 45

inference-optimization/Qwen3.6-35B-A3B-5.5-bits-mode-hybrid

Image-Text-to-Text • 26B • Updated 24 days ago • 72