Home
Jobs
Inference Infrastructure

Inference Infrastructure Jobs

Browse 955 Inference Infrastructure jobs on Inference Jobs.

121-140 of 955 jobs

4wD-

Machine Learning Intern - Dynamic KV-Cache Modeling for Efficient LLM Inference

d-Matrix

Campbell, California, United States or Remote (California, United States)$30 – $59 Hourly

AI Research

Data Science

2wNV

Senior Deep Learning Performance Architect

NVIDIA

California, United States (Hybrid)$152k – $287.5k Yearly

Deep Learning

GPU Architecture

4dNV

Senior Compiler Engineer, AI Inference Performance

NVIDIA

Santa Clara, California, United States (On-site)$152k – $241.5k Yearly

AI Compiler Engineering

Compiler Engineering

6dNE

ML Engineer, Large Language Models (LLM Training & Inference Optimization)

Nebius

Europe (Remote)

AI Engineer

Deep Learning

2wOP

Software Engineer, Model Inference

OpenAI

San Francisco, California, United States (On-site)$325k – $490k Yearly

Distributed Systems

3wGR

Senior Staff Engineer

Graphcore

Bristol, England, United Kingdom (On-site)

Machine Learning

ML Engineering

2wD-

Senior Runtime Systems Engineer

d-Matrix

Santa Clara, California, United States (Hybrid)

Embedded Systems

Firmware Engineering

3dCO

Senior Software Engineer I, Inference

CoreWeave

Sunnyvale, California, United States (Hybrid)$139k – $204k Yearly

AI/ML Engineering

Backend Engineer

2wNV

Senior Deep Learning Engineer

NVIDIA

Warszawa, Masovian Voivodeship, Poland (Hybrid)zł 292.5k – zł 507k Yearly

AI Engineer

Deep Learning Engineer

1wNV

Senior ML Framework Performance Engineer - AI for Science at Scale

NVIDIA

Santa Clara, California, United States (On-site)$184k – $287.5k Yearly

AI Research

HPC Engineer

6dCE

Senior Research Engineer - Inference ML

Cerebras

Sunnyvale, California, United States (Hybrid)

AI Research Engineer

Deep Learning

3wXA

Member of Technical Staff, Model Evaluation

xAI

Palo Alto, California, United States (On-site)$180k – $440k Yearly

AI Research Engineer

Machine Learning Engineer

4wNV

Product Manager - BioNeMo Inference

NVIDIA

New York, New York, United States (On-site)$168k – $258.8k Yearly

AI Product Management

Bioinformatics

4dNV

Software Engineer, TensorRT Specialized Platforms - New College Grad 2025

NVIDIA

Santa Clara, California, United States (On-site)$124k – $195.5k Yearly

AI Engineer

Deep Learning Engineer

2wSE

ML Engineer

Sesame

New York, New York, United States (On-site)$190k – $320k Yearly

AI Engineer

LLM Engineering

1dNV

Senior Systems Software Engineer - Deep Learning Solutions

NVIDIA

Toronto, Ontario, Canada (On-site)C$225k – C$275k Yearly

AI/ML Engineering

Autonomous Driving

3wNV

Senior Technical Program Manager, Deep Learning Libraries

NVIDIA

Santa Clara, California, United States (On-site)$168k – $322k Yearly

AI/ML

Deep Learning

2wCO

Staff Research Engineer, Model Efficiency

Cohere

New York, New York, United States (Hybrid)

AI Research

Deep Learning

2dNE

Developer Advocate - Token Factory

Nebius

On-site$165k – $250k Yearly

AI Engineering

Developer Advocacy

2wMA

Research Engineer

Magic

San Francisco, California, United States (On-site)$225k – $550k Yearly

AI Research

Applied Science

Inference Jobs

Machine Learning Intern - Dynamic KV-Cache Modeling for Efficient LLM Inference

Senior Deep Learning Performance Architect

Senior Compiler Engineer, AI Inference Performance

ML Engineer, Large Language Models (LLM Training & Inference Optimization)

Software Engineer, Model Inference

Senior Staff Engineer

Senior Runtime Systems Engineer

Senior Software Engineer I, Inference

Senior Deep Learning Engineer

Senior ML Framework Performance Engineer - AI for Science at Scale

Senior Research Engineer - Inference ML

Member of Technical Staff, Model Evaluation

Product Manager - BioNeMo Inference

Software Engineer, TensorRT Specialized Platforms - New College Grad 2025

ML Engineer

Senior Systems Software Engineer - Deep Learning Solutions

Senior Technical Program Manager, Deep Learning Libraries

Staff Research Engineer, Model Efficiency

Developer Advocate - Token Factory

Research Engineer

Related searches