Home
Jobs
Latency Optimization

Latency Optimization Jobs

Explore Latency Optimization roles on Inference Jobs and apply today.

2mo agoNV

Senior AI Inference Compiler Engineer

NVIDIA

Santa Clara, California, United States (On-site)$152K – $241.5K Yearly

Compiler Engineering

AI Engineering

Compiler Technologies

MLIR

3w agoET

Machine Learning Research Engineer

Etched

Cupertino, California, United States (On-site)

Machine Learning Engineer

AI Research Scientist

Python

Rust

3mo agoNV

Senior Power Analysis and Optimization Engineer, AI-LLM Systems

NVIDIA

Santa Clara, California, United States (On-site)$136K – $264.5K Yearly

Power Analysis Engineer

ASIC Design Engineer

Power Analysis

ASIC Design

1mo agoMO

Forward Deployed Engineer - ML

Modal

Stockholm, Sweden (On-site)

Machine Learning Engineer

ML Infrastructure

LLM Serving

Model Training

4w agoCE

Full Stack LLM Engineer

Cerebras

Toronto, Ontario, Canada (On-site)

Machine Learning Engineer

AI Engineering

Python

PyTorch

1mo agoNV

Senior LLVM Compiler Engineer

NVIDIA

Shanghai, Shanghai, China (On-site)

3mo agoPE

AI Inference Engineer (San Francisco)

Perplexity

San Francisco, California, United States (On-site)$210K – $385K Yearly

AI Engineering

Machine Learning Engineer

Python

Rust

3w agoOP

TL, Research Inference

OpenAI

San Francisco, California, United States (On-site)$380K – $555K Yearly

Research Engineering

Machine Learning Infrastructure

High-Performance Inference

Model Execution

3mo agoHA

LLM Inference Engineer

Hippocratic AI

Palo Alto, California, United States (On-site)

LLM Engineering

Machine Learning Engineering

LLM Inference

Distributed Serving

3mo agoPL

LLM Inference Engineer

Periodic Labs

Menlo Park, California, United States (On-site)

LLM Engineering

Machine Learning Infrastructure

LLM Inference

TensorRT-LLM

4w agoCE

Inference Core Platform Benchmarking Engineer

Cerebras

Toronto, Ontario, Canada (Hybrid)

Performance Engineering

Platform Engineering

Python

C++

3mo agoCE

Performance Engineer - Inference

Cerebras

Toronto, Ontario, Canada (On-site)

Performance Engineering

Software Engineering

Computer Architecture

Deep Learning

2mo agoVE

Product Manager

Vertiv

United States (On-site)

Product Management

Data Center Operations

Product Management

Data Center Infrastructure Management (DCIM)

2mo agoNV

Senior Software Engineer, Quantized Inference

NVIDIA

Redmond, Washington, United States (On-site)$152K – $287.5K Yearly

Software Engineering

Machine Learning Engineer

Python

C++

3mo agoCO

Staff Research Engineer, Model Efficiency

Cohere

New York, United States (Hybrid)

Modeling

Machine Learning

Model Architecture

3mo agoOP

Inference Technical Lead, Sora

OpenAI

San Francisco, California, United States (Hybrid)$380K – $380K Yearly

Inference Engineering

AI Infrastructure

Inference

GPU Computing

4w agoCE

Performance Engineer

Cerebras

Toronto, Ontario, Canada (On-site)

Performance Engineering

Software Engineering

C/C++

Python

2w agoTA

Senior Machine Learning Engineer, Voice AI

Together AI

San Francisco, California, United States (On-site)$200K – $260K Yearly

Machine Learning Engineer

AI Engineer

Machine Learning

Python

3mo agoD-

Machine Learning Intern - Dynamic KV-Cache Modeling for Efficient LLM Inference

d-Matrix

Santa Clara, Ca, Ca, United States or Remote (California, United States)$30 – $59 Hourly

Machine Learning Intern

AI Research

Machine Learning

Large Language Models (LLM)

3mo agoSE

ML Model Serving Engineer

Sesame

San Francisco, California, United States (On-site)$175K – $280K Yearly

Machine Learning Engineer

AI Engineer

LLM Serving

VLLM

Subscribe to this search

Get email updates when new jobs match this search.

Email address

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies

For Companies

Post a job

Resources

Locations
Salaries
Sitemap

About

About