Home
Jobs
vLLM

vLLM Jobs

Browse 56 vLLM jobs on Inference Jobs.

21-40 of 56 jobs

2w ago

Senior Software Engineer, Deep Learning Inference

NVIDIA

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)$150K – $200K Yearly

Deep Learning Inference Engineering

GPU Software Development

CUDA

Triton

4d ago

Senior Product Manager, Local AI and Agents for Enterprise

NVIDIA

Santa Clara, California, United States (On-site)$168K – $327.8K Yearly

Product Management

AI Product Management

Linux

PyTorch

1w ago

Member of Technical Staff - RL Inference

xAI

Palo Alto, California, United States (On-site)

RL Inference Engineering

ML Infrastructure Engineering

Python

C++

3w ago

Senior Software Developer: Models Team (Token Factory)

Nebius

Amsterdam, North Holland, Netherlands (Hybrid)

AI Infrastructure Engineering

Machine Learning Engineering

Python

4d ago

AI Inference Performance Engineer - New College Grad 2026

NVIDIA

Santa Clara, California, United States (On-site)$124K – $241.5K Yearly

AI Engineering

Machine Learning Infrastructure

TensorRT-LLM

SGLang

4d ago

Senior Inference Engineer, AIConfigurator for Dynamo

NVIDIA

Santa Clara, California, United States (Hybrid)$184K – $356.5K Yearly

4d ago

Engineering Manager, Inference Benchmarking — AI Perf

NVIDIA

Worldwide (Remote)$224K – $356.5K Yearly

Engineering Management

Performance Engineering

LLM Inference

vLLM

4d ago

Senior DL Algorithms Engineer - Inference Performance

NVIDIA

Santa Clara, California, United States (On-site)$152K – $287.5K Yearly

Deep Learning Engineer

Algorithms Engineer

Deep Learning

Inference

4d ago

Senior DL Software Engineer, Model Optimization and Edge Deployment - Autonomous Vehicles

NVIDIA

Santa Clara, California, United States (On-site)$184K – $356.5K Yearly

Deep Learning Engineering

Model Optimization

PyTorch

JAX

3w ago

Member of Technical Staff, Model Efficiency

Cohere

New York, US or Remote (Worldwide)

Modeling

Machine Learning Engineer

C++

Python

4w ago

LLM Inference Frameworks and Optimization Engineer

Together AI

San Francisco, California, United States (On-site)$160K – $230K Yearly

Machine Learning Engineer

AI Research Engineer

TensorRT-LLM

vLLM

4w ago

Senior Performance Engineer - LLM Inference Frameworks

NVIDIA

Yokne'am, Northern District, Israel (Hybrid)

Performance Engineering

LLM Inference

Python

PyTorch

3w ago

Software Engineer - Model Performance

Baseten

San Francisco, California, US or Remote (Worldwide)$180K – $360K Yearly

Software Engineering

Machine Learning Engineering

Python

C++

4d ago

Senior Software Engineer, AI Inference Systems

NVIDIA

Santa Clara, California, United States (Hybrid)$184K – $356.5K Yearly

2d ago

Senior Deep Learning Software Engineer, Inference

NVIDIA

United States (Remote)$152K – $287.5K Yearly

Deep Learning Engineering

GPU Programming

C/C++

Python

13h ago

Forward Deployed Engineer - ML

Modal

Stockholm, Sweden (On-site)

Machine Learning Engineer

ML Infrastructure

LLM Serving

Model Training

14h ago

AI Infrastructure Engineer, Model Serving Platform

Scale

San Francisco, California, United States (On-site)$216K – $270K Yearly

ML Infrastructure

Machine Learning Engineer

Python

3w ago

Engineering Manager - Forward Deployed Engineering (LLM)

Baseten

San Francisco, California, US or Remote (Worldwide)$260K – $380K Yearly

Engineering Management

Forward Deployed Engineering

Python

LLMs

4w ago

AI Researcher, Core ML

Together AI

San Francisco, California, United States (On-site)$200K – $280K Yearly

13h ago

Senior Sales Engineer

Nebius

United States (Remote)$152K – $228K Yearly

Sales Engineering

Solutions Engineering

AI Inference

GPU Computing

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies
Pricing

For Companies

Post a job
Pricing

Resources

Locations
Salaries
Sitemap

About

About