Latency Optimization Jobs

C++

1w agoNV

Senior Deep Learning Solution Architect

NVIDIA

Beijing, Beijing, China (On-site)

Solution Architecture

Machine Learning Engineering

LLM Inference

1w agoAN

TPU Kernel Engineer

Anthropic

San Francisco, California, United States (Hybrid)$280K – $850K Yearly

Kernel Engineering

TPU

ML Systems

3mo agoCO

Audio Inference Engineer, Model Efficiency

Cohere

New York, United States or Remote (New York, United States + 3 more)

AI Infrastructure

C++

Infrastructure Engineering

2mo agoAN

[P] Compute Efficiency Engineer

Anthropic

San Francisco, California, United States (Hybrid)$1 – $2 Yearly

Compute

Distributed Systems

Cloud Infrastructure

3w agoNV

AI Computing Software Development Intern - 2026

NVIDIA

臺北市, Taipei, Taiwan (On-site)

Software Engineering Intern

AI Engineering

Artificial Intelligence

TensorRT-LLM

2mo agoNV

Senior Software Engineer – TensorRT Edge-LLM

NVIDIA

Santa Clara, California, United States (Hybrid)$152K – $287.5K Yearly

5d agoCE

ML Research Engineer (Inference)

Cerebras

Bengaluru, Karnataka, India (On-site)

AI Research

PyTorch

7d agoNV

Solutions Architect - Top AI Labs

NVIDIA

Beijing, Beijing, China (On-site)

Solutions Architecture

AI Engineering

LLM Inference

vLLM

3mo agoCO

Member of Technical Staff, Model Efficiency

Cohere

New York, United States or Remote (New York, United States + 3 more)

Modeling

C++

4w agoNV

AI Computing Performance Architect

NVIDIA

Shanghai, Shanghai, China (On-site)

Computer Architecture

AI Engineering

Machine Learning

2w agoNV

Deep Learning Algorithms Engineer - ACOT

NVIDIA

Ho Chi Minh City, Ho Chi Minh City, Vietnam (On-site)

Algorithms Engineer

CUDA

1mo agoNV

Senior Performance Engineer - Deep Learning

NVIDIA

Santa Clara, California, United States (On-site)$152K – $241.5K Yearly

3mo agoOP

Software Engineer, Model Inference

OpenAI

San Francisco, California, United States (On-site)$325K – $490K Yearly

1mo agoNV

Senior DL Algorithms Engineer - Inference Performance

NVIDIA

Santa Clara, California, United States (On-site)$184K – $356.5K Yearly

Deep Learning Engineer

Algorithms Engineer