Low Latency Optimization Jobs

C++

3mo agoOP

Software Engineer, Model Inference

OpenAI

San Francisco, California, United States (On-site)$325K – $490K Yearly

4w agoCE

LLM Inference Performance & Evals Engineer

Cerebras

Toronto, Ontario, Canada (On-site)

LLM Engineering

C++

3mo agoBA

Software Engineer - Model Performance

Baseten

San Francisco, California, United States (On-site)$150K – $250K Yearly

4w agoTE

CPU Architect, Load-Store

Tenstorrent

United States (Remote)$100K – $500K Yearly

4w agoTA

AI Researcher, Core ML

Together AI

San Francisco, California, United States (On-site)$200K – $280K Yearly

4w agoNE

ML Engineer - Life Sciences (Early Talent)

Nebius

Amsterdam, North Holland, Netherlands (On-site)

AI Engineer

Machine Learning

1mo agoNV

Senior DL Algorithms Engineer - Inference Performance

NVIDIA

Santa Clara, California, United States (On-site)$184K – $356.5K Yearly

Deep Learning Engineer

Algorithms Engineer

Machine Learning Engineering

Inference

2mo agoPO

Member of Engineering (Pre-training / CUDA)

Poolside

Europe + 1 more (Remote)

Applied Research

CUDA

PyTorch

3mo agoPE

Search Rust Engineer (London, Belgrade, Berlin)

Perplexity

Belgrade, Belgrade, Serbia (On-site)

Backend Engineering

Rust

Search Infrastructure

2mo agoNE

Senior ML Engineer (Token Factory)

Nebius

Netherlands + 4 more (Remote)

Machine Learning Engineering

AI Infrastructure

Machine Learning

Transformer Architecture

2mo agoNV

Senior Machine Learning Engineer, Quantized Inference

NVIDIA

Redmond, Washington, United States (On-site)$152K – $287.5K Yearly

AI Engineer

Infrastructure Engineering

PyTorch

4w agoAN

Engineering Manager, Inference Routing and Performance

Anthropic

San Francisco, California, United States (Hybrid)$405K – $485K Yearly

Engineering Management

Distributed Systems

Inference Routing

2w agoGR

Distinguished Engineer - Inference Serving Network and Storage

Graphcore

Austin, Texas, United States (On-site)

3mo agoBA

Software Engineer, Model Performance Tooling

Baseten

Canada or Remote (Canada + 1 more)C$130K – C$200K Yearly

Software Engineering

Machine Learning Engineering

C++

4w agoTA

Senior Backend Engineer, Inference Platform

Together AI

San Francisco, California, United States (On-site)$160K – $250K Yearly

Backend Engineering

Platform Engineering

Rust

2mo agoNV

Senior Applied Deep Learning Research Scientist, Efficiency

NVIDIA

Santa Clara, California, United States (On-site)$192K – $356.5K Yearly

Deep Learning Research

Applied Science

Machine Learning Infrastructure

1mo agoNV

AI Inference Performance Engineer - New College Grad 2026

NVIDIA

Santa Clara, California, United States (On-site)$124K – $241.5K Yearly

AI Engineering

TensorRT-LLM

SGLang

2w agoNV

Deep Learning Performance Architect

NVIDIA

Shanghai, Shanghai, China (On-site)

AI Architecture

High-Performance Computing

3mo agoMO

Member of Technical Staff - ML Performance

Modal

New York, United States (On-site)$150K – $270K Yearly

Engineering