High Performance ML Systems Jobs

AI Research

Machine Learning

Reinforcement Learning

4w agoTA

Senior Backend Engineer, Inference Platform

Together AI

San Francisco, California, United States (On-site)$160K – $250K Yearly

Backend Engineering

Platform Engineering

Machine Learning Infrastructure

3w agoTM

Research Engineer, Infrastructure, Inference

Thinking Machines Lab

San Francisco, California, United States (On-site)$350K – $475K Yearly

AI Infrastructure

PyTorch

JAX

2mo agoNV

Principal Software Engineer - AI Inference

NVIDIA

Santa Clara, California, United States (On-site)$272K – $431.3K Yearly

1mo agoD-

Principal Architect, Performance Analysis and Modeling

d-Matrix

Santa Clara, California, United States (Hybrid)$190K – $280K Yearly

Computer Architecture

AI Hardware

Computer Architecture

Hardware Software Codesign

3mo agoBA

Engineering Manager - Model Performance

Baseten

San Francisco, California, United States (On-site)$230K – $300K Yearly

Engineering Management

ML Engineering

AI Research & Engineering

C++

1w agoAN

Staff Infrastructure Engineer, Pre-training

Anthropic

San Francisco, California, United States (Hybrid)$350K – $850K Yearly

MLOps

Machine Learning Research

2mo agoTA

Research Engineer, Frontier Speculative Decoding

Together AI

San Francisco, California, United States (On-site)$190K – $270K Yearly

Research Engineer

Speculative Decoding

Data Curation

1mo agoNV

AI Inference Performance Engineer - New College Grad 2026

NVIDIA

Santa Clara, California, United States (On-site)$124K – $241.5K Yearly

AI Engineering

Machine Learning Infrastructure

TensorRT-LLM

SGLang

6d agoCE

Manager, Kernel Software

Cerebras

Bengaluru, Karnataka, India (On-site)

Software Engineering Management

Kernel Development

C++

Machine Learning Infrastructure

3mo agoBA

Senior Product Engineer - Training Platform

Baseten

San Francisco, California, United States (On-site)$200K – $275K Yearly

Distributed Systems Engineering

Kubernetes

PyTorch

1w agoNV

Solutions Architect - Top AI Labs

NVIDIA

Beijing, Beijing, China (On-site)

Solutions Architecture

AI Engineering

LLM Inference

vLLM

2w agoNV

Senior AI ML Solution Engineer, AI-Native Development

NVIDIA

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)

AI/ML Engineer

Machine Learning Pipelines

LLM Prompting

3mo agoCA

Inference Engineer

Cartesia

San Francisco, California, United States (On-site)$180K – $250K Yearly

Inference Engineering

Machine Learning Engineering

Model Inference

Distributed Systems

4w agoCO

Solutions Architect- Networking

CoreWeave

Livingston, New Jersey, United States (Hybrid)$165K – $220K Yearly

Solutions Architecture

Cloud Architecture

Kubernetes

Cloud Infrastructure

2mo agoTA

Machine Learning, Platform Engineer

Together AI

San Francisco, California, United States (On-site)$160K – $250K Yearly

2mo agoXA

Member of Technical Staff, Inference

xAI

Palo Alto, California, United States (On-site)$180K – $440K Yearly

AI Infrastructure

3mo agoCO

Audio Inference Engineer, Model Efficiency

Cohere

New York, United States or Remote (New York, United States + 3 more)

AI Infrastructure

C++

Research Infrastructure (ML Infra)

2mo agoTM

Research Infrastructure Engineer, Research Acceleration

Thinking Machines Lab

San Francisco, California, United States (On-site)$350K – $475K Yearly