Home
Jobs
United States
California
San Francisco
vLLM

vLLM Jobs in San Francisco, California, United States

Browse 36 vLLM jobs in San Francisco, California, United States on Inference Jobs.

21-36 of 36 jobs

4w ago

Software Engineer - Model Performance

Baseten

San Francisco, California, US or Remote (Worldwide)$180K – $360K Yearly

Software Engineering

Machine Learning Engineering

Python

C++

2w ago

Engineering Manager, Inference Benchmarking — AI Perf

NVIDIA

Worldwide (Remote)$224K – $356.5K Yearly

Engineering Management

Performance Engineering

LLM Inference

vLLM

4w ago

Manager, Solutions Architect

Baseten

Worldwide (Remote)$165K – $330K Yearly

Solution Architecture

Solutions Engineering

AI/ML

LLM

2w ago

Senior Software Engineer, AI and DL Kernel Libraries

NVIDIA

United States (Remote)$184K – $287.5K Yearly

AI Systems Engineering

GPU Computing

Python

C++

2w ago

Senior Deep Learning Software Engineer, Inference

NVIDIA

United States (Remote)$152K – $287.5K Yearly

Deep Learning Engineering

GPU Programming

C/C++

Python

1w ago

Senior Sales Engineer

Nebius

United States (Remote)$152K – $228K Yearly

Sales Engineering

Solutions Engineering

AI Inference

GPU Computing

2d ago

Deep Learning Software Engineer, Inference - New College Grad 2026

NVIDIA

United States (Remote)$124K – $241.5K Yearly

Deep Learning Engineering

Machine Learning Engineering

C++

Python

2w ago

Senior Research Scientist, Nemotron Post-training

NVIDIA

United States (Remote)$192K – $356.5K Yearly

Research Scientist

Post-training Engineer

Reinforcement Learning

Agentic Systems

1w ago

Solution Architect

Baseten

San Francisco, California, US or Remote (Worldwide)$165K – $330K Yearly

Solution Architecture

Sales Engineering

Artificial Intelligence

Machine Learning

4w ago

Member of Engineering (Post-training)

Poolside

Europe, Middle East, and Africa, North America (Remote)

Applied Research

Machine Learning Engineering

Large Language Models (LLM)

Transformers

4w ago

Software Engineer - Model API's

Baseten

San Francisco, California, US or Remote (Worldwide)$180K – $360K Yearly

1w ago

Applied Agentic AI Lead, Partner Co-Design

NVIDIA

United States (Remote)$224K – $431.3K Yearly

3w ago

Data Scientist, Evals

Perplexity

London, England, GB or Remote (United States)$200K – $300K Yearly

4w ago

Senior ML Systems Engineer, Frameworks & Tooling

Cohere

London, England, GB or Remote (Worldwide)

Machine Learning Engineer

MLOps

JAX

Distributed Systems

4w ago

Open-Source Machine Learning Engineer - US Remote

Hugging Face

United States (Remote)

Open Source

Machine Learning Engineering

Python

PyTorch

3w ago

Software Engineer- BIS (Baseten Inference Stack)

Baseten

United States (Remote)$180K – $360K Yearly

Software Engineering

Infrastructure Engineering

Distributed Systems

Kubernetes

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies
Pricing

For Companies

Post a job
Pricing

Resources

Locations
Salaries
Sitemap

About

About