yafengio

Follow

Focusing

MARATRIX yafengio

Focusing

Follow

Yet another developer in AI Infra | Cloud Native :: [@weibocom, @meili, mogujie, @baidu]

45 followers · 425 following

@MooreThreads
Beijing, China
13:09 (UTC +08:00)

Achievements

Achievements

yafengio/README.md

Hello, I'm yafengio 👋

Pinned Loading

sgl-project/ome sgl-project/ome Public

Open Model Engine (OME) — Kubernetes operator for LLM serving, GPU scheduling, and model lifecycle management. Works with SGLang, vLLM, TensorRT-LLM, and Triton

Go 404 66
dynamo dynamo Public

Forked from ai-dynamo/dynamo

A Datacenter Scale Distributed Inference Serving Framework

Rust
lws lws Public

Forked from kubernetes-sigs/lws

LeaderWorkerSet: An API for deploying a group of pods as a unit of replication

Go
Mooncake Mooncake Public

Forked from kvcache-ai/Mooncake

Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

C++
sglang sglang Public

Forked from sgl-project/sglang

SGLang is a fast serving framework for large language models and vision language models.

Python
torchada torchada Public

Forked from MooreThreads/torchada

Adapter package for torch_musa to act exactly like PyTorch CUDA

Python