LLM Inference Optimization Jobs

Machine Learning Engineering

vLLM

2d ago

Senior Machine Learning Engineer, LLM Inference Optimization

Nebius

Palo Alto, California, United States (On-site)$195.2K – $262.2K Yearly

LLM Inference Optimization

Machine Learning Engineering

4w ago

LLM Inference Engineer

Hippocratic AI

Palo Alto, California, United States (On-site)

LLM Engineering

LLM Inference

Distributed Serving

3w ago

D-

Principal LLM Inference Engineer

d-Matrix

United States (Remote)$195K – $285K Yearly

LLM Inference Engineering

AI Infrastructure Engineer

Deep Learning Research Engineering

C/C++

2w ago

Senior Deep Learning Research Engineer, LLM Inference

NVIDIA

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)

LLM Inference Optimization

4d ago

Senior Performance Engineer - LLM Inference Frameworks

NVIDIA

Yokne'am, Northern District, Israel (On-site)

Performance Engineering

LLM Inference

ML Infrastructure Engineering

3w ago

Member of Technical Staff - Inference Research

Modal

New York, United States (On-site)$150K – $350K Yearly

Engineering

LLM Inference

Speculative Decoding

3w ago

Member of Technical Staff - RL Inference

xAI

Palo Alto, California, United States (On-site)

RL Inference Engineering

ML Infrastructure Engineering

Machine Learning Research

C++

2w ago

Senior DL Algorithms Engineer - Inference Performance

NVIDIA

Santa Clara, California, United States (On-site)$152K – $287.5K Yearly

Deep Learning Engineer

Algorithms Engineer

Deep Learning

Inference

1w ago

Sr. Staff Machine Learning Researcher - Model Training & Optimization

Tenstorrent

Toronto, Ontario, Canada (Hybrid)$100K – $500K Yearly

ML Models

Deep Learning Inference Engineering

4w ago

Senior Software Engineer, Deep Learning Inference

NVIDIA

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)$150K – $200K Yearly

GPU Software Development

CUDA

Triton

2w ago

AI Inference Performance Engineer - New College Grad 2026

NVIDIA

Santa Clara, California, United States (On-site)$124K – $241.5K Yearly

AI Engineering

Machine Learning Infrastructure

SGLang

4w ago

Solution Architect (AI/LLM Inference)

Baseten

Worldwide (Remote)$165K – $330K Yearly

Solution Architecture

AI/ML Sales Engineering

AI/ML

AI Infrastructure Engineer

6d ago

AI Inference Performance Engineer

NVIDIA

Santa Clara, California, United States (On-site)$152K – $241.5K Yearly

Performance Engineer

Machine Learning Research

SGLang

3w ago

Researcher, Training - London

OpenAI

London, England, United Kingdom (Hybrid)£170K – £445K Yearly

LLM Research

LLM Architectures

Long-context

3w ago

Research Engineer, Post-Training Inference

Together AI

San Francisco, California, United States (On-site)$200K – $290K Yearly

Research Engineering

ML Infrastructure Engineering

LLM Performance Engineering

2w ago

Engineering Manager, LLM Performance

NVIDIA

Santa Clara, California, United States (On-site)$224K – $431.3K Yearly

Engineering Manager

Machine Learning Engineer

vLLM

4w ago

ML Model Serving Engineer

Sesame

San Francisco, California, United States (On-site)$175K – $280K Yearly

AI Engineer

Machine Learning Research

vLLM

22h ago

D-

Senior Staff ML Researcher - LLM Algorithmic Optimization

d-Matrix

Santa Clara, California, United States (Hybrid)$155K – $235K Yearly

LLM Research