Best list

Best Inference Servers for Open Models

Compare vLLM, SGLang, TGI, LocalAI, LiteLLM, and BentoML for serving open models and routing inference.

Top picks

vLLM

SGLang

TGI

LiteLLM

Benchmark serving stacks on your exact model, context length, quantization, and traffic pattern.

Built an AI tool or open-source project? Submit it for review or sponsor a featured placement on OpenSourcesAI.