Inference-Time Compute Jobs

Rust

Machine Learning Infrastructure

3d ago

AI Inference Performance Engineer - New College Grad 2026

NVIDIA

Santa Clara, California, United States (On-site)$124K – $241.5K Yearly

AI Engineering

TensorRT-LLM

SGLang

3w ago

Software Engineer, Model Routing & Inference

Cursor

New York, United States (On-site)

3w ago

Audio Inference Engineer, Model Efficiency

Cohere

New York, US or Remote (Canada + 4 more)

AI Infrastructure

C++

3d ago

Solutions Architect, Inference Deployments

NVIDIA

Santa Clara, California, United States (On-site)$152K – $241.5K Yearly

Solutions Architecture

Generative AI

Kubernetes

TensorRT-LLM

6d ago

Senior Software Engineer, Inference

Anthropic

Dublin, Dublin, Ireland (Hybrid)€235K – €295K Yearly

Machine Learning Engineering

Machine Learning Systems

3d ago

Senior Software Engineer, AI Inference Systems

NVIDIA

Santa Clara, California, United States (Hybrid)$184K – $356.5K Yearly

1d ago

Senior Software Engineer, AI Inference Systems

NVIDIA

Toronto, Ontario, Canada (Hybrid)C$170K – C$275K Yearly

3w ago

Software Engineer, Model Inference

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

4w ago

Sr. Software Engineer, Inference

Anthropic

London, England, United Kingdom (Hybrid)£225K – £325K Yearly

Infrastructure Engineering

Machine Learning Systems

3w ago

LLM Inference Frameworks and Optimization Engineer

Together AI

San Francisco, California, United States (On-site)$160K – $230K Yearly

ML Infrastructure Engineering

AI Research Engineer

TensorRT-LLM

vLLM

1w ago

Research Engineer, Post-Training Inference

Together AI

San Francisco, California, United States (On-site)$200K – $290K Yearly

Research Engineering

1w ago

Member of Technical Staff, Inference

xAI

Palo Alto, California, United States (On-site)$180K – $440K Yearly

AI Research & Engineering

AI Infrastructure

Rust

C++

4w ago

Staff Software Engineer, Inference

Anthropic

Leinster, Ireland (Hybrid)€295K – €355K Yearly

Technical Program Management

LLM Inference

2w ago

Technical Program Manager, Inference

CoreWeave

Livingston, New Jersey, United States (On-site)$198K – $264K Yearly

AI/ML Platform Engineering

GPU Compute

4w ago

Staff Software Engineer, Inference

Anthropic

London, England, United Kingdom (Hybrid)£325K – £390K Yearly

ML Infrastructure Engineering

Machine Learning

1w ago

Member of Technical Staff - RL Inference

xAI

Palo Alto, California, United States (On-site)

RL Inference Engineering

C++

4w ago

Software Engineer, Inference AI/ML

CoreWeave

Sunnyvale, California, United States (Hybrid)$92K – $135K Yearly

Machine Learning Engineering

AI/ML Software Development

4w ago

AI Computing Software Development Engineer, LLM Inference

NVIDIA

Shanghai, Shanghai, China (On-site)

Deep Learning Engineering

C/C++

TensorRT

4w ago

Senior Performance Engineer - LLM Inference Frameworks

NVIDIA

Yokne'am, Northern District, Israel (Hybrid)

Performance Engineering

LLM Inference