Home
Jobs
GPU Inference

GPU Inference Jobs

Browse 43 GPU Inference jobs on Inference Jobs.

43 jobs

3w ago

Software Engineer, Inference – AMD GPU Enablement

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

3w ago

Inference Technical Lead, Sora

OpenAI

San Francisco, California, United States (Hybrid)$380K – $380K Yearly

Inference Engineering

AI Infrastructure

GPU Inference

Model Serving

4w ago

TL, Research Inference

OpenAI

San Francisco, California, United States (On-site)$380K – $555K Yearly

Research Engineering

Machine Learning Infrastructure

High-Performance Inference

Model Execution

3d ago

Senior Inference Engineer, AIConfigurator for Dynamo

NVIDIA

Santa Clara, California, United States (Hybrid)$184K – $356.5K Yearly

3w ago

AI Inference Engineer (London)

Perplexity

London, England, United Kingdom (On-site)

AI Inference Engineer

Machine Learning Engineer

Rust

Python

3w ago

AI Inference Engineer (San Francisco)

Perplexity

San Francisco, California, United States (On-site)$220K – $485K Yearly

AI Engineering

Machine Learning Engineer

Rust

Python

2w ago

Senior Software Engineer, Deep Learning Inference

NVIDIA

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)$150K – $200K Yearly

Deep Learning Inference Engineering

GPU Software Development

CUDA

Triton

2w ago

D-

Principal LLM Inference Engineer

d-Matrix

United States (Remote)$195K – $285K Yearly

LLM Inference Engineering

AI Infrastructure Engineer

Python

C/C++

3d ago

Senior DL Algorithms Engineer - Inference Performance

NVIDIA

Santa Clara, California, United States (On-site)$152K – $287.5K Yearly

Deep Learning Engineer

Algorithms Engineer

Deep Learning

Inference

4d ago

Solutions Architect, Inference Deployments

NVIDIA

Santa Clara, California, United States (On-site)$152K – $241.5K Yearly

Solutions Architecture

Generative AI

Kubernetes

TensorRT-LLM

3w ago

Software Engineer, Inference - Multi Modal

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

Software Engineer

Inference Engineer

Inference Infrastructure

Multimodal Models

1w ago

Staff Software Engineer, Inference

CoreWeave

Sunnyvale, California, United States (Hybrid)$188K – $275K Yearly

Staff Software Engineer

Inference Engineering

Python

3d ago

GPU Performance Engineer - Neural Reconstruction

NVIDIA

United States (Remote)$224K – $431.3K Yearly

GPU Performance Engineering

Neural Reconstruction

Python

C++

3d ago

Senior Deep Learning Research Engineer, LLM Inference

NVIDIA

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)

Deep Learning Research Engineering

LLM Inference Optimization

Python

PyTorch

2d ago

Senior Deep Learning Software Engineer, Inference

NVIDIA

United States (Remote)$152K – $287.5K Yearly

Deep Learning Engineering

GPU Programming

C/C++

Python

4d ago

AI Inference Performance Engineer - New College Grad 2026

NVIDIA

Santa Clara, California, United States (On-site)$124K – $241.5K Yearly

AI Engineering

Machine Learning Infrastructure

TensorRT-LLM

SGLang

3w ago

Software Engineer, Model Inference

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

2w ago

LLM Inference Engineer

Hippocratic AI

Palo Alto, California, United States (On-site)

LLM Engineering

Machine Learning Engineering

LLM Inference

Distributed Serving

1w ago

Member of Technical Staff - Inference Research

Modal

New York, United States (On-site)$150K – $350K Yearly

Engineering

ML Infrastructure Engineering

LLM Inference

Speculative Decoding

3d ago

GPU Performance Engineer - Neural Reconstruction

NVIDIA

Canada (Remote)C$225K – C$340K Yearly

GPU Performance Engineer

CUDA Engineer

CUDA

C++

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies
Pricing

For Companies

Post a job
Pricing

Resources

Locations
Salaries
Sitemap

About

About