inference-x/benchmarks/bench_20260216_163305.md

# Inference-X Benchmark Results

**Date:** 2026-02-16T16:33:05Z
**Hardware:** AMD EPYC-Rome Processor | 17GB RAM | 6 cores | AVX2
**Engine:** Inference-X v1.0.0

| Model | Params | Quant | Prefill (tok/s) | Generate (tok/s) | First Token (s) | RAM Peak |
|-------|--------|-------|-----------------|------------------|-----------------|----------|