Home
Jobs
Inference Accelerators

Inference Accelerators Jobs

Browse 38 Inference Accelerators jobs on Inference Jobs.

38 jobs

2w ago

Staff AI Inference and Acceleration Engineer

Figure

San Jose, California, United States (On-site)$180K – $275K Yearly

AI/ML Inference Engineering

Hardware Acceleration

AI/ML Inference

ONNX

3w ago

Software Engineer, Inference – AMD GPU Enablement

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

2w ago

D-

Principal LLM Inference Engineer

d-Matrix

United States (Remote)$195K – $285K Yearly

LLM Inference Engineering

AI Infrastructure Engineer

Python

C/C++

2d ago

Senior Inference Engineer, AIConfigurator for Dynamo

NVIDIA

Santa Clara, California, United States (Hybrid)$184K – $356.5K Yearly

3w ago

Inference Intern

Etched

San Jose, California, United States (On-site)

Inference Architecture

AI Accelerator Engineering

Python

C++

4w ago

Inference Technical Lead, On-Device Transformers

OpenAI

San Francisco, California, United States (Hybrid)$445K – $445K Yearly

Machine Learning

Inference Engineering

CUDA

ML Runtimes

4w ago

Inference Software Engineer

Etched

Cupertino, California, United States (On-site)

Inference Engineering

Machine Learning Infrastructure

C++

Python

3d ago

AI Inference Performance Engineer - New College Grad 2026

NVIDIA

Santa Clara, California, United States (On-site)$124K – $241.5K Yearly

AI Engineering

Machine Learning Infrastructure

TensorRT-LLM

SGLang

2w ago

Inference Engineer

Cartesia

San Francisco, California, United States (On-site)$180K – $250K Yearly

Inference Engineering

Machine Learning Engineering

Model Inference

Distributed Systems

3d ago

Solutions Architect, Inference Deployments

NVIDIA

Santa Clara, California, United States (On-site)$152K – $241.5K Yearly

Solutions Architecture

Generative AI

Kubernetes

TensorRT-LLM

3w ago

Inference Technical Lead, Sora

OpenAI

San Francisco, California, United States (Hybrid)$380K – $380K Yearly

Inference Engineering

AI Infrastructure

GPU Inference

Model Serving

4w ago

TL, Research Inference

OpenAI

San Francisco, California, United States (On-site)$380K – $555K Yearly

Research Engineering

Machine Learning Infrastructure

High-Performance Inference

Model Execution

2w ago

AI Inference Engineer (London)

Perplexity

London, England, United Kingdom (On-site)

AI Inference Engineer

Machine Learning Engineer

Rust

Python

2w ago

LLM Inference Engineer

Hippocratic AI

Palo Alto, California, United States (On-site)

LLM Engineering

Machine Learning Engineering

LLM Inference

Distributed Serving

4w ago

Research Intern, Inference (Fall 2026)

Together AI

San Francisco, California, United States (On-site)$58 – $63 Hourly

1w ago

Member of Technical Staff - Inference Research

Modal

New York, United States (On-site)$150K – $350K Yearly

Engineering

ML Infrastructure Engineering

LLM Inference

Speculative Decoding

3w ago

Software Engineer, Inference - Performance Optimization

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

Scaling

Inference

Performance Profiling

Benchmarking

2d ago

Senior DL Algorithms Engineer - Inference Performance

NVIDIA

Santa Clara, California, United States (On-site)$152K – $287.5K Yearly

Deep Learning Engineer

Algorithms Engineer

Deep Learning

Inference

3w ago

Software Engineer, Inference - Multi Modal

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

Software Engineer

Inference Engineer

Inference Infrastructure

Multimodal Models

3w ago

Performance Engineer, Inference Systems

Anthropic

San Francisco, California, United States (Hybrid)$350K – $850K Yearly

Performance Engineering

Inference Systems

Python

SQL

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies
Pricing

For Companies

Post a job
Pricing

Resources

Locations
Salaries
Sitemap

About

About