Inference Jobs

Jobs Companies

Home
Jobs
LLM Serving

LLM Serving Jobs

Explore LLM Serving roles on Inference Jobs and apply today.

1mo agoNE

Senior Sales Engineer

Nebius

United States (Remote)$152K – $228K Yearly

Sales Engineering

Solutions Engineering

AI Inference

GPU Computing

4w agoLA

Deployed Engineer (Charlotte)

LangChain

North Carolina, United States (Remote)$150K – $250K Yearly

4w agoNV

Deep Learning Engineer, LLM Accuracy Evaluation

NVIDIA

Zürich, Switzerland (On-site)

1mo agoNV

AI Inference Performance Engineer - New College Grad 2026

NVIDIA

Santa Clara, California, United States (On-site)$124K – $241.5K Yearly

AI Engineering

Machine Learning Infrastructure

TensorRT-LLM

SGLang

1mo agoNV

Senior Deep Learning Algorithm Engineer, Training Framework

NVIDIA

Santa Clara, California, United States (Hybrid)$184K – $287.5K Yearly

2mo agoNV

Senior Software Engineer – TensorRT Edge-LLM

NVIDIA

Santa Clara, California, United States (Hybrid)$152K – $287.5K Yearly

1w agoNV

Senior Solutions Architect - KV Cache and AI Storage

NVIDIA

Beijing, Beijing, China (Hybrid)

1mo agoNV

Senior DL Algorithms Engineer - Inference Performance

NVIDIA

Santa Clara, California, United States (On-site)$184K – $356.5K Yearly

Deep Learning Engineer

Algorithms Engineer

Deep Learning

Inference

4w agoNV

Deep Learning Engineer - LLM and VLM Model Compression

NVIDIA

Warszawa, Masovian Voivodeship, Poland (On-site)zł 292.5K – zł 650K Yearly

Deep Learning

Machine Learning Engineering

Deep Learning

Large Language Models

2mo agoNE

Senior ML Engineer (Token Factory)

Nebius

Netherlands + 4 more (Remote)

Machine Learning Engineering

AI Infrastructure

Machine Learning

Transformer Architecture

2w agoNV

Solutions Architect - Deep Neural Network Evaluation

NVIDIA

Europe, Middle East, and Africa (Remote)zł 292.5K – zł 507K Yearly

Solutions Architecture

AI Engineering

Deep Neural Networks

Agentic AI

3mo agoLA

Deployed Engineer (West)

LangChain

San Francisco, California, United States (On-site)$150K – $270K Yearly

Deployed Engineering

Solutions Engineering

LangChain

LangGraph

2mo agoNV

Principal Software Engineer - AI Inference

NVIDIA

Santa Clara, California, United States (On-site)$272K – $431.3K Yearly

3d agoSC

Tech Lead Manager- MLRE, ML Systems

Scale

San Francisco, California, United States (On-site)$264.8K – $331K Yearly

3mo agoOP

TLM, Machine Learning, Integrity

OpenAI

San Francisco, California, United States (On-site)$405K – $490K Yearly

Engineering Management

Machine Learning Engineering

Machine Learning

LLMs

3mo agoCO

Senior Research Engineer, Model Evaluation

Cohere

Toronto, Ontario, Canada or Remote (Canada + 2 more)

4w agoSC

ML Research Engineer, ML Systems

Scale

San Francisco, California, United States (On-site)$218.4K – $273K Yearly

Machine Learning Engineer

ML Research

CUDA

PyTorch

3mo agoPE

AI Engineer, Applied ML

Perplexity

San Francisco, California, United States (On-site)$210K – $385K Yearly

Machine Learning Engineer

AI Engineer

Machine Learning

LLMs

2mo agoDE

Staff Software Engineer, ML Infrastructure

Decagon

San Francisco, California, United States (On-site)$300K – $430K Yearly

Engineering

Infrastructure Engineering

Python

PyTorch

2w agoNV

Senior Deep Learning Software Engineer, Inference

NVIDIA

Netherlands + 1 more (Remote)zł 221.3K – zł 383.5K Yearly

Subscribe to this search

Get email updates when new jobs match this search.

Email address

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies

For Companies

Post a job

Resources

Locations
Salaries
Sitemap

About

About