Home
Jobs
Inference-Time Compute

Inference-Time Compute Jobs

Explore Inference-Time Compute roles on Inference Jobs and apply today.

3mo agoBA

Software Engineer - Model Performance

Baseten

San Francisco, California, United States (On-site)$150K – $250K Yearly

2w agoTE

Staff Engineer, Server Inference

Tenstorrent

Belgrade, Belgrade, Serbia (Hybrid)

Backend Engineering

Machine Learning Engineering

API Design

Backend Development

1mo agoD-

Principal Architect, Performance Analysis and Modeling

d-Matrix

Santa Clara, California, United States (Hybrid)$190K – $280K Yearly

Computer Architecture

AI Hardware

Computer Architecture

Hardware Software Codesign

3w agoTA

Senior Backend Engineer, Inference Platform

Together AI

San Francisco, California, United States (On-site)$160K – $250K Yearly

Backend Engineering

Platform Engineering

Rust

2w agoNV

Senior Deep Learning Engineer

NVIDIA

United Kingdom (Hybrid)zł 221.3K – zł 383.5K Yearly

Deep Learning

Machine Learning Engineering

Deep Learning

Python

2mo agoNV

Senior Systems Software Engineer - Deep Learning Solutions

NVIDIA

Toronto, Ontario, Canada (On-site)C$225K – C$275K Yearly

Systems Software Engineering

Deep Learning

Deep Learning Inference

CUDA

4w agoVA

GPU Systems Engineer – HPC / Parallel Computing

Vast.ai

San Francisco, California, United States (On-site)$160K – $320K Yearly

2mo agoAN

Staff + Senior Software Engineer, Cloud Inference

Anthropic

San Francisco, California, United States (Hybrid)$300K – $485K Yearly

Software Engineering - Infrastructure

Cloud Infrastructure

AWS

GCP

3mo agoSE

ML Model Serving Engineer

Sesame

San Francisco, California, United States (On-site)$175K – $280K Yearly

Machine Learning Engineer

AI Engineer

LLM Serving

VLLM

2w agoNV

Senior Software Architect, AI Networking

NVIDIA

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)

Software Architecture

AI/ML Engineering

Distributed Systems

C++

2mo agoNV

Senior Software Engineer – TensorRT Edge-LLM

NVIDIA

Santa Clara, California, United States (Hybrid)$152K – $287.5K Yearly

3mo agoD-

ML Compiler Architect, Senior Principal

d-Matrix

Toronto, Ontario, Canada (Hybrid)

Compiler Engineering

Machine Learning Compiler

MLIR

LLVM

3mo agoNE

System Engineer (Token Factory)

Nebius

Netherlands + 5 more (Remote)

3mo agoNE

Senior ML Engineer (Token Factory)

Nebius

Amsterdam, North Holland, NL

Machine Learning Engineer

AI Infrastructure

C++

GPU Programming

2mo agoNV

Senior Compiler Engineer - Compute Front-End

NVIDIA

Santa Clara, California, United States (On-site)$152K – $287.5K Yearly

3mo agoCE

Senior Runtime Engineer

Cerebras

Sunnyvale, California, United States (On-site)

2mo agoNV

AI Computing Software Development Engineer, TensorRT

NVIDIA

Shanghai, Shanghai, China (On-site)

3w agoTM

Research Engineer, Infrastructure, Kernels

Thinking Machines Lab

San Francisco, California, United States (On-site)$350K – $475K Yearly

Machine Learning Infrastructure

AI Research Engineer

CUDA

CuTe

4w agoCE

Full Stack LLM Engineer

Cerebras

Toronto, Ontario, Canada (On-site)

Machine Learning Engineer

AI Engineering

Python

PyTorch

2w agoCE

Advanced Technology Compiler Engineer

Cerebras

Vancouver, British Columbia, Canada (On-site)

Subscribe to this search

Get email updates when new jobs match this search.

Email address

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies

For Companies

Post a job

Resources

Locations
Salaries
Sitemap

About

About