High-Concurrency GPU Inference Batching System | System Design