Home
Jobs
LLM Serving Engineering

LLM Serving Engineering Jobs

Browse 22 LLM Serving Engineering jobs on Inference Jobs.

22 jobs

4w ago

ML Model Serving Engineer

Sesame

San Francisco, California, United States (On-site)$175K – $280K Yearly

Machine Learning Engineer

AI Engineer

PyTorch

vLLM

4w ago

LLM Inference Engineer

Hippocratic AI

Palo Alto, California, United States (On-site)

LLM Engineering

Machine Learning Engineering

LLM Inference

Distributed Serving

3d ago

Senior Machine Learning Engineer, LLM Inference Optimization

Nebius

Palo Alto, California, United States (On-site)$195.2K – $262.2K Yearly

Machine Learning Engineering

LLM Inference Optimization

Python

PyTorch

11h ago

AI Infrastructure Engineer, Serving Platform

Scale

London, England, United Kingdom (On-site)

ML Infrastructure

Backend Engineering

Python

2w ago

AI Infrastructure Engineer, Model Serving Platform

Scale

San Francisco, California, United States (On-site)$216K – $270K Yearly

ML Infrastructure

Machine Learning Engineer

Python

3w ago

D-

Principal LLM Inference Engineer

d-Matrix

United States (Remote)$195K – $285K Yearly

LLM Inference Engineering

AI Infrastructure Engineer

Python

C/C++

4w ago

Forward Deployed Engineer - LLM Post-training

Reflection AI

San Francisco, California, United States (On-site)

Forward Deployed Engineer

ML Engineer

Python

Fine-tuning

3h ago

Engineering Manager - Forward Deployed Engineering (LLM)

Baseten

San Francisco, California, US or Remote (Worldwide)$260K – $380K Yearly

Engineering Management

Forward Deployed Engineering

Python

LLMs

2w ago

Senior Software Engineer, AI Inference

NVIDIA

Toronto, Ontario, Canada (Hybrid)C$170K – C$220K Yearly

Senior Software Engineering

AI/ML Engineering

vLLM

Kubernetes

2w ago

Senior Deep Learning Research Engineer, LLM Inference

NVIDIA

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)

Deep Learning Research Engineering

LLM Inference Optimization

Python

PyTorch

3h ago

Solution Architect (AI/LLM Inference)

Baseten

Worldwide (Remote)$165K – $330K Yearly

Solution Architecture

AI/ML Sales Engineering

AI/ML

Python

2w ago

Engineering Manager, LLM Performance

NVIDIA

Santa Clara, California, United States (On-site)$224K – $431.3K Yearly

Engineering Manager

LLM Performance Engineering

TensorRT-LLM

vLLM

4w ago

Senior Machine Learning Engineer, Voice AI

Together AI

San Francisco, California, United States (On-site)$200K – $260K Yearly

Machine Learning Engineer

AI Engineer

Machine Learning

Python

5d ago

LLM Inference Frameworks and Optimization Engineer

Together AI

San Francisco, California, United States (On-site)$160K – $230K Yearly

Machine Learning Engineer

AI Research Engineer

TensorRT-LLM

vLLM

6d ago

Staff Machine Learning Engineer, Voice AI

Together AI

San Francisco, California, United States (On-site)$220K – $280K Yearly

Machine Learning Engineering

Voice AI Engineering

TensorRT-LLM

SGLang

3d ago

LLM Reinforcement Learning Framework Engineer

NVIDIA

Shanghai, Shanghai, China (On-site)

LLM Engineering

Reinforcement Learning Engineering

Python

PyTorch

2w ago

Forward Deployed Engineer - ML

Modal

Stockholm, Sweden (On-site)

Machine Learning Engineer

ML Infrastructure

LLM Serving

Model Training

11h ago

Senior Software Engineer, ML Infrastructure

SambaNova

United States (Remote)$200K – $275K Yearly

2w ago

Solutions Architect, LLM Model Builder

NVIDIA

Santa Clara, California, United States (On-site)$152K – $241.5K Yearly

Solutions Architecture

Machine Learning Engineering

LLMs

VLMs

2w ago

Speech LLM Engineer, Voice-First Agentic AI

NVIDIA

Ho Chi Minh City, Ho Chi Minh City, Vietnam (On-site)

Speech LLM Engineer

Voice-First AI Engineer

Python

PyTorch

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies
Pricing

For Companies

Post a job
Pricing

Resources

Locations
Salaries
Sitemap

About

About