Home
Jobs
AI Model Inference

AI Model Inference Jobs

Browse 57 AI Model Inference jobs on Inference Jobs.

57 jobs

1d ago

Director/Sr. Manager, AI Inference Model Scaling

Cerebras

Sunnyvale, California, United States (Hybrid)

4w ago

Inference Engineer

Cartesia

San Francisco, California, United States (On-site)$180K – $250K Yearly

Inference Engineering

Machine Learning Engineering

Model Inference

Distributed Systems

19h ago

Software Engineer, Model Inference

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

4w ago

AI Inference Engineer (London)

Perplexity

London, England, United Kingdom (On-site)

AI Inference Engineer

Machine Learning Engineer

Rust

Python

19h ago

Software Engineer, Inference - Multi Modal

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

Software Engineer

Inference Engineer

Inference Infrastructure

Multimodal Models

19h ago

Inference Technical Lead, Sora

OpenAI

San Francisco, California, United States (Hybrid)$380K – $380K Yearly

Inference Engineering

AI Infrastructure

GPU Inference

Model Serving

1d ago

Staff Inference ML Runtime Engineer

Cerebras

United States (On-site)

Machine Learning Engineering

Software Engineering

Python

C++

4w ago

LLM Inference Engineer

Hippocratic AI

Palo Alto, California, United States (On-site)

LLM Engineering

Machine Learning Engineering

LLM Inference

Distributed Serving

7d ago

TL, Research Inference

OpenAI

San Francisco, California, United States (On-site)$380K – $555K Yearly

Research Engineering

Machine Learning Infrastructure

High-Performance Inference

Model Execution

4w ago

Staff AI Inference and Acceleration Engineer

Figure

San Jose, California, United States (On-site)$180K – $275K Yearly

AI/ML Inference Engineering

Hardware Acceleration

AI/ML Inference

ONNX

4d ago

Software Engineer, Model Routing & Inference

Cursor

New York, United States (On-site)

5d ago

Applied AI Inference Engineer

Crusoe

San Francisco, California, United States (On-site)$250K – $300K Yearly

19h ago

Applied AI Inference Engineer

Baseten

San Francisco, California, US or Remote (California, United States + 1 more)$165K – $330K Yearly

Applied AI Engineering

Machine Learning Engineer

Python

Docker

19h ago

Software Engineer, Inference - Performance Optimization

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

Scaling

Inference

Performance Profiling

Benchmarking

2w ago

Solutions Architect, Inference Deployments

NVIDIA

Santa Clara, California, United States (On-site)$152K – $241.5K Yearly

Solutions Architecture

Generative AI

Kubernetes

TensorRT-LLM

3w ago

Member of Technical Staff - Inference Research

Modal

New York, United States (On-site)$150K – $350K Yearly

Engineering

ML Infrastructure Engineering

LLM Inference

Speculative Decoding

3w ago

Research Engineer, Post-Training Inference

Together AI

San Francisco, California, United States (On-site)$200K – $290K Yearly

Research Engineering

ML Infrastructure Engineering

Python

1d ago

ML Research Engineer (Inference)

Cerebras

Bengaluru, Karnataka, India (On-site)

ML Research Engineering

Machine Learning Engineering

Python

PyTorch

2w ago

Research Intern, Inference (Fall 2026)

Together AI

San Francisco, California, United States (On-site)$58 – $63 Hourly

19h ago

Solution Architect (AI/LLM Inference)

Baseten

Worldwide (Remote)$165K – $330K Yearly

Solution Architecture

AI/ML Sales Engineering

AI/ML

Python

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies
Pricing

For Companies

Post a job
Pricing

Resources

Locations
Salaries
Sitemap

About

About