Home
Jobs
Inference Capacity

Inference Capacity Jobs

Browse 285 Inference Capacity jobs on Inference Jobs.

41-60 of 285 jobs

1wPO

Member of Engineering (Inference)

Poolside

United Kingdom or Remote (Europe + 1 more)

AI Engineer

Deep Learning Engineer

2wRA

Member of Technical Staff - GPU Infrastructure

Reflection AI

San Francisco, California, United States (On-site)

GPU Infrastructure

Infrastructure Engineering

4wD-

Machine Learning Intern - Dynamic KV-Cache Modeling for Efficient LLM Inference

d-Matrix

Campbell, California, United States or Remote (California, United States)$30 – $59 Hourly

AI Research

Data Science

5dCO

Director of Engineering, Inference Services

CoreWeave

Sunnyvale, California, United States (Hybrid)$206k – $303k Yearly

AI/ML Engineering

Cloud Engineering

1wPO

Member of Engineering (Pre-training and inference software)

Poolside

United Kingdom or Remote (Europe, Middle East, and Africa, North America)

AI Research Engineer

Deep Learning

2wD-

Senior Staff Machine Learning Engineer -Frameworks

d-Matrix

Santa Clara, California, United States (Hybrid)$155k – $250k Yearly

AI Engineer

Machine Learning Engineer

3dNV

Senior Compiler Engineer, AI Inference Performance

NVIDIA

Santa Clara, California, United States (On-site)$152k – $241.5k Yearly

AI Compiler Engineering

Compiler Engineering

2wCE

Engineering Manager, Inference Platform

Cerebras

Sunnyvale, California, United States (On-site)

AI Infrastructure

Distributed Systems Engineering

1wBA

Engineering Manager - Forward Deployed Engineering (LLM)

Baseten

San Francisco, California, United States (On-site)$220k – $285k Yearly

AI Engineering

Engineering Management

1wNV

Senior ML Framework Performance Engineer - AI for Science at Scale

NVIDIA

Santa Clara, California, United States (On-site)$184k – $287.5k Yearly

AI Research

HPC Engineer

3dNV

Senior Compiler Engineer, AI Inference Platforms

NVIDIA

Santa Clara, California, United States (On-site)$152k – $241.5k Yearly

AI Engineering

Compiler Engineering

2wNV

Senior Deep Learning Performance Architect

NVIDIA

California, United States (Hybrid)$152k – $287.5k Yearly

Deep Learning

GPU Architecture

5dXA

Member of Technical Staff, RL Training Framework

xAI

Palo Alto, California, United States (On-site)$180k – $440k Yearly

AI Engineer

Backend Engineer

3wCO

Software Engineer, Inference AI/ML

CoreWeave

Sunnyvale, California, United States (Hybrid)$92k – $135k Yearly

AI/ML Infrastructure

Backend Development

2wNV

Senior Software Engineer, Deep Learning Inference - TensorRT

NVIDIA

Santa Clara, California, United States (Hybrid)$152k – $287.5k Yearly

AI/Machine Learning

C++ Development

3wXA

Member of Technical Staff, Model Evaluation

xAI

Palo Alto, California, United States (On-site)$180k – $440k Yearly

AI Research Engineer

Machine Learning Engineer

11hNV

Senior Software Engineer, Quantized Inference

NVIDIA

Redmond, Washington, United States (On-site)$152k – $287.5k Yearly

AI Infrastructure

Deep Learning

2wNV

Senior Systems Engineer – High-Performance AI and Networking Applications

NVIDIA

Santa Clara, California, United States (On-site)$184k – $356.5k Yearly

AI Infrastructure

High-Performance Computing

2wPE

UK Internship Program

Perplexity

London, England, United Kingdom (Hybrid)

High-Performance Computing

2wNE

Senior ML Engineer (Token Factory)

Nebius

Amsterdam, North Holland, Netherlands (On-site)

AI Infrastructure

GPU Computing

Inference Jobs

Member of Engineering (Inference)

Member of Technical Staff - GPU Infrastructure

Machine Learning Intern - Dynamic KV-Cache Modeling for Efficient LLM Inference

Director of Engineering, Inference Services

Member of Engineering (Pre-training and inference software)

Senior Staff Machine Learning Engineer -Frameworks

Senior Compiler Engineer, AI Inference Performance

Engineering Manager, Inference Platform

Engineering Manager - Forward Deployed Engineering (LLM)

Senior ML Framework Performance Engineer - AI for Science at Scale

Senior Compiler Engineer, AI Inference Platforms

Senior Deep Learning Performance Architect

Member of Technical Staff, RL Training Framework

Software Engineer, Inference AI/ML

Senior Software Engineer, Deep Learning Inference - TensorRT

Member of Technical Staff, Model Evaluation

Senior Software Engineer, Quantized Inference

Senior Systems Engineer – High-Performance AI and Networking Applications

UK Internship Program

Senior ML Engineer (Token Factory)

Related searches