Home
Jobs
United States
California
vLLM

vLLM Jobs in California, United States

Browse 53 vLLM jobs in California, United States on Inference Jobs.

21-40 of 53 jobs

1d ago

AI Models, Product Manager

Cerebras

Sunnyvale, California, United States (Hybrid)

Product Management

AI/ML Product Management

Python

PyTorch

6d ago

AI Researcher, Core ML

Together AI

San Francisco, California, United States (On-site)$200K – $280K Yearly

6d ago

Applied AI Inference Engineer

Crusoe

San Francisco, California, United States (On-site)$250K – $300K Yearly

2w ago

ML Systems Engineer

Periodic Labs

Menlo Park, California, United States (On-site)$300K – $400K Yearly

ML Systems Engineer

Machine Learning Infrastructure

Ray

Slurm

1d ago

Product Manager, Strategic Verticals

Cerebras

Sunnyvale, California, United States (Hybrid)

Product Management

Technical Product Management

Product Management

LLMs

2w ago

Research Engineer, Core ML

Together AI

San Francisco, California, United States (On-site)$200K – $280K Yearly

Machine Learning Research

Machine Learning Engineer

RL Algorithms

Inference Optimization

3w ago

Research Engineer, Post-Training Inference

Together AI

San Francisco, California, United States (On-site)$200K – $290K Yearly

Research Engineering

ML Infrastructure Engineering

Python

2w ago

Senior AI Software Engineer, Kernel Libraries

NVIDIA

Santa Clara, California, United States (On-site)$184K – $287.5K Yearly

AI Engineering

Machine Learning Engineering

Python

C++

4d ago

Senior Applied Scientist, Efficient LLM Inference & Model Optimization

Nebius

Palo Alto, California, United States (On-site)$195.2K – $262.2K Yearly

1d ago

Senior Performance Engineer, Inference

Cerebras

Sunnyvale, California, United States (On-site)

Performance Engineering

ML Infrastructure Engineering

vLLM

SGLang

3d ago

D-

Senior Staff ML Researcher - LLM Algorithmic Optimization

d-Matrix

Santa Clara, California, United States (Hybrid)$155K – $235K Yearly

Machine Learning Research

LLM Research

Python

OOP

23h ago

Software Engineer, Inference - Multi Modal

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

Software Engineer

Inference Engineer

Inference Infrastructure

Multimodal Models

2w ago

Staff Software Engineer, Model LifeCycle

Crusoe

San Francisco, California, United States (On-site)$208.7K – $279.6K Yearly

Machine Learning Engineering

AI Infrastructure

Large Language Models

Generative AI

3w ago

Account Solution Architect

CoreWeave

Sunnyvale, California, United States (On-site)$140K – $210K Yearly

Solutions Architecture

AI Field Engineering

Python

Deep Learning Models

2w ago

Senior Systems Performance Engineer

NVIDIA

Santa Clara, California, United States (On-site)$168K – $258.8K Yearly

Systems Performance Engineering

Hardware Validation

Dynamo

TensorRT

2w ago

Solutions Architect, Inference Deployments

NVIDIA

Santa Clara, California, United States (On-site)$152K – $241.5K Yearly

Solutions Architecture

Generative AI

Kubernetes

TensorRT-LLM

23h ago

Solution Architect (AI/LLM Inference)

Baseten

Worldwide (Remote)$165K – $330K Yearly

Solution Architecture

AI/ML Sales Engineering

AI/ML

Python

2w ago

ML Solution Architect (Early Talent)

Nebius

United States (Remote)$102 – $126 Hourly

ML Solutions Architect

Machine Learning Engineer

Python

PyTorch

4w ago

Principal ML Solutions Architect - Token Factory

Nebius

United States (Remote)$208K – $261K Yearly

Principal Solutions Architect

ML Solutions Architect

Python

vLLM

4w ago

D-

Principal LLM Inference Engineer

d-Matrix

United States (Remote)$195K – $285K Yearly

LLM Inference Engineering

AI Infrastructure Engineer

Python

C/C++

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies
Pricing

For Companies

Post a job
Pricing

Resources

Locations
Salaries
Sitemap

About

About