EmmaOpt · GitHub

Popular repositories Loading

mlu-ops mlu-ops Public

Forked from Cambricon/mlu-ops

Efficient operation implementation based on the Cambricon Machine Learning Unit (MLU) .

C++
vllm-cn vllm-cn Public

Forked from hyperai/vllm-cn

vLLM Documentation in Chinese Simplified / vLLM 中文文档

TypeScript
vllm_dump vllm_dump Public

Forked from vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

Python 1
FlashMLA FlashMLA Public

Forked from deepseek-ai/FlashMLA

FlashMLA: Efficient MLA decoding kernels

Cuda
cutlass cutlass Public

Forked from NVIDIA/cutlass

CUDA Templates for Linear Algebra Subroutines

C++