Low-latency ML Inference Jobs

5d ago

ML Runtime Optimization Engineer

Applied Intuition

Sunnyvale, California, United States (On-site)$159.1K – $199.3K Yearly

Embedded Software Engineering

JAX

2w ago

Inference Technical Lead, On-Device Transformers

OpenAI

San Francisco, California, United States (Hybrid)$445K – $445K Yearly

Machine Learning

Inference Engineering

CUDA

ML Runtimes

4d ago

Inference Technical Lead, Sora

OpenAI

San Francisco, California, United States (Hybrid)$380K – $380K Yearly

Inference Engineering

AI Infrastructure

GPU Inference

Model Serving

2w ago

Software Engineer, Inference AI/ML

CoreWeave

Sunnyvale, California, United States (Hybrid)$92K – $135K Yearly

Software Engineering

Cloud Platform Engineering

1d ago

Engineering Manager, Inference Benchmarking — AI Perf

NVIDIA

United States (Remote)$224K – $356.5K Yearly

Engineering Management

Performance Engineering

LLM Inference

vLLM

2w ago

Staff Software Engineer, Inference Cloud

Cerebras

Sunnyvale, California, United States (On-site)

Staff Software Engineer

Distributed Systems Architecture

Cloud Infrastructure

2w ago

LLM Inference Performance & Evals Engineer

Cerebras

Toronto, Ontario, Canada (On-site)

Machine Learning Engineer

LLM Engineering

Machine Learning Research

C++

2w ago

AI Researcher, Core ML

Together AI

San Francisco, California, United States (On-site)$200K – $280K Yearly

2w ago

Research, Audio Expertise

Thinking Machines Lab

San Francisco, California, United States (On-site)$350K – $475K Yearly

AI Research

3w ago

Staff Software Engineer, Inference

CoreWeave

Sunnyvale, California, United States (Hybrid)$188K – $275K Yearly

Staff Software Engineer

Inference Engineering

2w ago

Staff Engineer, Server Inference

Tenstorrent

Belgrade, Belgrade, Serbia (Hybrid)

Backend Engineering

API Design

Backend Development

4d ago

Software Engineer - Model Performance

Baseten

San Francisco, California, US or Remote (Worldwide)$180K – $360K Yearly

Software Engineering

C++

3w ago

Solutions Architect, Cloud Inference Services

NVIDIA

Zürich, Switzerland (On-site)

Solutions Architecture

Cloud Architecture

Neural Network Inference

Agentic Pipelines

4d ago

Sr. Machine Learning Engineer, ML Models

Tenstorrent

Toronto, Ontario, Canada (Hybrid)C$100K – C$500K Yearly

ML Models

Machine Learning Engineer

2w ago

Machine Learning Engineer

Together AI

San Francisco, California, United States (On-site)$160K – $220K Yearly

AI Engineer

Machine Learning

LLMs

2w ago

Tech Lead Manager- MLRE, ML Systems

Scale

San Francisco, California, United States (On-site)$264.8K – $331K Yearly

2w ago

Engineering Manager, Model Serving

Together AI

San Francisco, California, United States (On-site)$250K – $300K Yearly

Engineering Manager

Multi-cluster Orchestration

Kubernetes

1w ago

Staff Engineer (ML Engineer)

Graphcore

Cambridge, England, United Kingdom (On-site)

ML Quality Assurance

2w ago

Senior Software Engineer, Inference

Anthropic

Dublin, Dublin, Ireland (Hybrid)€235K – €295K Yearly

Software Engineering