Home
Jobs
Latency Optimization

Latency Optimization Jobs

Browse 21 Latency Optimization jobs on Inference Jobs.

21 jobs

3w ago

Software Engineer, Inference - Performance Optimization

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

Scaling

Inference

Performance Profiling

Benchmarking

3w ago

Performance & Systems Engineer, Codex

OpenAI

San Francisco, California, United States (Hybrid)$295K – $445K Yearly

Systems Engineering

Performance Engineering

LLM Inference

Cloud Orchestration

3w ago

LLM Inference Frameworks and Optimization Engineer

Together AI

San Francisco, California, United States (On-site)$160K – $230K Yearly

Machine Learning Engineer

AI Research Engineer

TensorRT-LLM

vLLM

3w ago

Performance Engineer, Inference Systems

Anthropic

San Francisco, California, United States (Hybrid)$350K – $850K Yearly

Performance Engineering

Inference Systems

Python

SQL

2w ago

Developer Relations Manager, cuOpt and Graph Optimization

NVIDIA

Beijing, Beijing, China (On-site)

Developer Relations

cuOpt

GPU Accelerated Computing

cuOpt

2w ago

Sr. Engineer, Kernel Development and Optimization

Tenstorrent

Belgrade, Belgrade, Serbia (Hybrid)

2w ago

LLM Inference Engineer

Hippocratic AI

Palo Alto, California, United States (On-site)

LLM Engineering

Machine Learning Engineering

LLM Inference

Distributed Serving

3d ago

Senior DL Software Engineer, Model Optimization and Edge Deployment - Autonomous Vehicles

NVIDIA

Santa Clara, California, United States (On-site)$184K – $356.5K Yearly

Deep Learning Engineering

Model Optimization

PyTorch

JAX

4w ago

Software Engineer, Kernel Development and Optimization

Tenstorrent

Gdańsk, Pomeranian Voivodeship, Poland (Hybrid)

Kernel Development

GPU Kernel Optimization

C++

Kernel Development

4w ago

Sr. Staff Machine Learning Researcher - Model Training & Optimization

Tenstorrent

Toronto, Ontario, Canada (Hybrid)$100K – $500K Yearly

ML Models

Machine Learning Research

Python

PyTorch

3w ago

Staff Research Engineer, Model Efficiency

Cohere

New York, US or Remote (Worldwide)

Modeling

Machine Learning

Model Architecture

1w ago

Solutions Architect - CPU and LPU

NVIDIA

Beijing, Beijing, China (On-site)

Solutions Architecture

AI Infrastructure

NVIDIA Grace

NVIDIA Vera

2w ago

Senior Search Applications Performance Engineer

Cohere

Worldwide (Remote)

Search Applications Engineer

Performance Engineering

Python

Opensearch

3w ago

ML Model Serving Engineer

Sesame

San Francisco, California, United States (On-site)$175K – $280K Yearly

Machine Learning Engineer

AI Engineer

PyTorch

vLLM

2w ago

Compiler Optimization Engineer - LLVM

NVIDIA

Bengaluru, Karnataka, India (On-site)

2w ago

Power Optimization Engineer

Etched

Cupertino, California, United States (On-site)

1w ago

Senior Deep Learning Solution Architect

NVIDIA

Beijing, Beijing, China (Hybrid)

Deep Learning

Solution Architecture

Deep Learning

LLM Inference

3w ago

Staff Technical Program Manager, Managed Intelligence

Crusoe

San Francisco, California, United States (On-site)$193.1K – $234K Yearly

Technical Program Management

Technical Program Manager

Technical Program Management

Multi-quarter release planning

3w ago

Software Engineer, Foundations Retrieval

OpenAI

San Francisco, California, United States (On-site)$380K – $555K Yearly

Software Engineering

Information Retrieval

Distributed Systems

Information Retrieval

1d ago

ML Engineer, Generative Video

Mirage

New York, United States (On-site)$175K – $275K Yearly

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies
Pricing

For Companies

Post a job
Pricing

Resources

Locations
Salaries
Sitemap

About

About