Inference Accelerators Jobs

Software Engineering - Infrastructure

PyTorch

2w ago

Senior/Staff Software Engineer, Inference

Anthropic

San Francisco, California, United States (Hybrid)$300K – $485K Yearly

Hardware Software Codesign

Machine Learning Systems

2w ago

D-

Principal Architect, Performance Analysis and Modeling

d-Matrix

Santa Clara, California, United States (Hybrid)$190K – $280K Yearly

Computer Architecture

AI Hardware

Computer Architecture

2w ago

Staff Software Engineer, Inference

Anthropic

Leinster, Ireland (Hybrid)€295K – €355K Yearly

AI Research & Engineering

Machine Learning Engineer

2w ago

Machine Learning Engineer - Inference

Together AI

San Francisco, California, United States (On-site)$160K – $230K Yearly

Inference Engineer

Cloud Platform Engineering

PyTorch

2w ago

Staff Software Engineer, Inference Cloud

Cerebras

Sunnyvale, California, United States (On-site)

Staff Software Engineer

Distributed Systems Architecture

Cloud Infrastructure

2w ago

Staff Software Engineer, Inference

Anthropic

London, England, United Kingdom (Hybrid)£325K – £390K Yearly

AI Infrastructure Engineering

Machine Learning

4w ago

Senior Software Engineer, AI Inference Systems

NVIDIA

Germany (Hybrid)zł 292.5K – zł 650K Yearly

GPU Systems Engineer

Machine Learning Engineering

C/C++

2w ago

Engineering Manager, Inference ML Runtime

Cerebras

Sunnyvale, California, United States (On-site)

Engineering Management

AI Research & Engineering

C++

2w ago

Engineering Manager, Inference

Anthropic

San Francisco, California, United States (Hybrid)$425K – $560K Yearly

Engineering Management

Machine Learning

2w ago

Solution Architect – Accelerated Computing Libraries

NVIDIA

Beijing, Beijing, China (On-site)

2w ago

System Engineer (Token Factory)

Nebius

Netherlands + 5 more (Remote)

3d ago

Inference Engineering Manager

Perplexity

San Francisco, California, United States (On-site)$300K – $485K Yearly

Engineering Management

Machine Learning Infrastructure

PyTorch

5d ago

Software Engineer, Accelerators

OpenAI

San Francisco, California, United States (On-site)$295K – $380K Yearly

Machine Learning Engineer

Kernels

AI Infrastructure

2w ago

Solution Architecture Intern, AI in Industry - 2026

NVIDIA

Beijing, Beijing, China (On-site)

Solution Architecture

AI Engineering

Accelerated Computing

Linux

2w ago

Member of Technical Staff, Inference & RL Systems

Magic

San Francisco, California, United States (On-site)$225K – $550K Yearly

Software Engineer

Software Engineering - Infrastructure

Reinforcement Learning

2w ago

Senior Deep Learning Solution Architect

NVIDIA

Beijing, Beijing, China (On-site)

Deep Learning

Solution Architecture

Deep Learning

LLM Inference

2w ago

Staff + Senior Software Engineer, Cloud Inference

Anthropic

San Francisco, California, United States (Hybrid)$300K – $485K Yearly

Cloud Infrastructure

AWS

GCP

5d ago

Solution Architect (AI/LLM Inference)

Baseten

Worldwide (Remote)$165K – $330K Yearly

Solution Architecture

AI/ML Sales Engineering

AI/ML

2w ago

Senior System Software Engineer - Dynamo-Triton Inference Server

NVIDIA

Santa Clara, California, United States (On-site)$152K – $241.5K Yearly