Low Latency Optimization Jobs

Deep Learning Engineering

Cloud Orchestration

3d ago

Senior DL Software Engineer, Model Optimization and Edge Deployment - Autonomous Vehicles

NVIDIA

Santa Clara, California, United States (On-site)$184K – $356.5K Yearly

Model Optimization

JAX

3w ago

Performance Engineer, Inference Systems

Anthropic

San Francisco, California, United States (Hybrid)$350K – $850K Yearly

Inference Systems

Machine Learning Engineering

SQL

2w ago

Sr. Engineer, Kernel Development and Optimization

Tenstorrent

Belgrade, Belgrade, Serbia (Hybrid)

3d ago

SoC Product Architect Low Power SoC

NVIDIA

Santa Clara, California, United States (On-site)$224K – $431.3K Yearly

2w ago

Power Optimization Engineer

Etched

Cupertino, California, United States (On-site)

2w ago

LLM Inference Engineer

Hippocratic AI

Palo Alto, California, United States (On-site)

LLM Engineering

Machine Learning Engineer

Distributed Serving

4w ago

Software Engineer, Kernel Development and Optimization

Tenstorrent

Gdańsk, Pomeranian Voivodeship, Poland (Hybrid)

Kernel Development

GPU Kernel Optimization

C++

Kernel Development

3w ago

ML Model Serving Engineer

Sesame

San Francisco, California, United States (On-site)$175K – $280K Yearly

AI Engineer

Machine Learning Infrastructure

vLLM

4w ago

Software Engineer, Acceleration Kernel Development

Tenstorrent

Toronto, Ontario, Canada (Hybrid)C$100K – C$500K Yearly

4w ago

TL, Research Inference

OpenAI

San Francisco, California, United States (On-site)$380K – $555K Yearly

Research Engineering

High-Performance Inference

Model Execution

4w ago

Sr. Staff Machine Learning Researcher - Model Training & Optimization

Tenstorrent

Toronto, Ontario, Canada (Hybrid)$100K – $500K Yearly

ML Models

Machine Learning Research

Machine Learning Research

3w ago

Staff Research Engineer, Model Efficiency

Cohere

New York, US or Remote (Worldwide)

Modeling

Machine Learning

Model Architecture

4w ago

Research Engineer, Core ML

Together AI

San Francisco, California, United States (On-site)$200K – $280K Yearly

Machine Learning Engineer

RL Algorithms

Inference Optimization

1w ago

Solutions Architect - CPU and LPU

NVIDIA

Beijing, Beijing, China (On-site)

Solutions Architecture

AI Infrastructure

NVIDIA Grace

NVIDIA Vera

2w ago

Senior Search Applications Performance Engineer

Cohere

Worldwide (Remote)

Search Applications Engineer

Opensearch

4w ago

Senior Performance Engineer - LLM Inference Frameworks

NVIDIA

Yokne'am, Northern District, Israel (Hybrid)

1w ago

Senior Deep Learning Solution Architect

NVIDIA

Beijing, Beijing, China (Hybrid)

Deep Learning

Solution Architecture

Deep Learning