Low-latency Retrieval Jobs

Infrastructure Engineering

3w agoAN

Engineering Manager, Inference Routing and Performance

Anthropic

San Francisco, California, United States (Hybrid)$405K – $485K Yearly

Engineering Management

Distributed Systems

Inference Routing

2w agoAN

Research Engineer, Performance RL

Anthropic

San Francisco, California, United States (Hybrid)$350K – $850K Yearly

AI Research & Engineering

Machine Learning Infrastructure

CUDA

2w agoTM

Research Engineer, Infrastructure, RL Systems

Thinking Machines Lab

San Francisco, California, United States (On-site)$350K – $475K Yearly

Research Engineering

Machine Learning Research

Distributed Training

1mo agoCE

Applied Machine Learning Research Scientist

Cerebras

Sunnyvale, California, United States (On-site)

Applied Machine Learning

PyTorch

3w agoSC

Machine Learning Research Scientist / Research Engineer, Post-Training

Scale

San Francisco, California, United States (On-site)$252K – $315K Yearly

3w agoSC

ML Research Engineer, ML Systems

Scale

San Francisco, California, United States (On-site)$218.4K – $273K Yearly

ML Research

CUDA

PyTorch

1mo agoNV

Senior Deep Learning Scientist, Multimodal Conversational AI

NVIDIA

Santa Clara, California, United States (On-site)$184K – $287.5K Yearly

Machine Learning Scientist

Machine Learning Engineering

Large Language Models

6d agoAN

Research Engineer, Machine Learning (Horizons)

Anthropic

San Francisco, California, United States (Hybrid)$500K – $850K Yearly

AI Research

Machine Learning Infrastructure

1mo agoNV

AI Inference Performance Engineer - New College Grad 2026

NVIDIA

Santa Clara, California, United States (On-site)$124K – $241.5K Yearly

AI Engineering

TensorRT-LLM

SGLang

1mo agoNV

Research Scientist, Fundamental LLM Research for Knowledge, Reasoning, and Agents - New College Grad 2026

NVIDIA

Santa Clara, California, United States (On-site)$168K – $264.5K Yearly

3w agoNV

Deep Learning Engineer - LLM and VLM Model Compression

NVIDIA

Warszawa, Masovian Voivodeship, Poland (On-site)zł 292.5K – zł 650K Yearly

Machine Learning Engineering

Large Language Models

1mo agoNV

Senior Software Engineer, Quantized Inference

NVIDIA

Redmond, Washington, United States (On-site)$152K – $287.5K Yearly

Software Engineering

Machine Learning Research

C++

1mo agoAA

Senior AI Researcher- Reinforcement learning (f/m/d)

Aleph Alpha

Heidelberg, Baden-Württemberg, Germany (Hybrid)

AI Research

1w agoTA

Senior Machine Learning Engineer, Voice AI

Together AI

San Francisco, California, United States (On-site)$200K – $260K Yearly

AI Engineer

Machine Learning

Machine Learning Researcher

3w agoVA

AI Agent Researcher

Vast.ai

San Francisco, California, United States (On-site)$160K – $320K Yearly

AI Researcher

Machine Learning Research

C++

3w agoNV

Deep Learning Engineer, LLM Accuracy Evaluation

NVIDIA

Zürich, Switzerland (On-site)

3w agoSC

Machine Learning Research Scientist/ Engineer, Agents

Scale

San Francisco, California, United States (On-site)$275K – $350K Yearly

Technical Product Management

LLMs

PyTorch

19h agoNV

Senior Product Manager, AI Inference - Dynamo

NVIDIA

Santa Clara, California, United States (On-site)$208K – $327.8K Yearly

AI Product Management

Product Management

AI Inference

6d agoAN

Research Engineer, Pretraining Scaling (London)

Anthropic

London, England, United Kingdom (On-site)£260K – £630K Yearly

AI Research & Engineering