Home
Jobs
Ultra-low-latency

Ultra-low-latency Jobs

Browse 67 Ultra-low-latency jobs on Inference Jobs.

41-60 of 67 jobs

7d ago

Inference Technical Lead, On-Device Transformers

OpenAI

San Francisco, California, United States (Hybrid)$445K – $445K Yearly

Machine Learning

Inference Engineering

CUDA

ML Runtimes

21h ago

Staff Software Engineer, ML Performance & Systems

fal.ai

San Francisco, California, United States (On-site)$180K – $250K Yearly

Staff Software Engineer

ML Infrastructure Engineer

PyTorch

TensorRT

6d ago

Senior Performance Engineer

Crusoe

San Francisco, California, United States (On-site)$170K – $205K Yearly

Performance Engineering

Systems Engineering

Linux Kernel

2w ago

ML Systems Engineer

Periodic Labs

Menlo Park, California, United States (On-site)$300K – $400K Yearly

ML Systems Engineer

Machine Learning Infrastructure

Ray

Slurm

4d ago

Senior Machine Learning Engineer, LLM Inference Optimization

Nebius

Palo Alto, California, United States (On-site)$195.2K – $262.2K Yearly

Machine Learning Engineering

LLM Inference Optimization

Python

PyTorch

3w ago

Member of Technical Staff - RL Inference

xAI

Palo Alto, California, United States (On-site)

RL Inference Engineering

ML Infrastructure Engineering

Python

C++

5d ago

Senior Deep Learning Algorithms Engineer - BioNeMo

NVIDIA

Ho Chi Minh City, Ho Chi Minh City, Vietnam (On-site)

Deep Learning Engineering

AI Infrastructure

TensorRT-LLM

CUDA

4w ago

ML Model Serving Engineer

Sesame

San Francisco, California, United States (On-site)$175K – $280K Yearly

Machine Learning Engineer

AI Engineer

PyTorch

vLLM

3w ago

Solutions Architect - CPU and LPU

NVIDIA

Beijing, Beijing, China (On-site)

Solutions Architecture

AI Infrastructure

NVIDIA Grace

NVIDIA Vera

1w ago

Manager, Developer Relations - Industries

NVIDIA

Santa Clara, California, United States (On-site)$224K – $356.5K Yearly

Developer Relations

Developer Advocacy

GPU Computing

3w ago

Staff Software Engineer, Inference

CoreWeave

Sunnyvale, California, United States (Hybrid)$188K – $275K Yearly

Staff Software Engineer

Inference Engineering

Python

4w ago

D-

Principal LLM Inference Engineer

d-Matrix

United States (Remote)$195K – $285K Yearly

LLM Inference Engineering

AI Infrastructure Engineer

Python

C/C++

21h ago

Senior C++ Software Engineer (Defense Autonomy)

Applied Intuition

Ann Arbor, Michigan, United States (On-site)$150K – $250K Yearly

C++ Software Engineering

Defense Autonomy

C++

C++20

5d ago

Applied AI Inference Engineer

Crusoe

San Francisco, California, United States (On-site)$250K – $300K Yearly

21h ago

Senior C++ Software Engineer (Collaborative Autonomy)

Applied Intuition

Sunnyvale, California, United States (On-site)$150K – $250K Yearly

Senior C++ Software Engineer

Autonomy Engineer

C++

C++20

4d ago

Senior Applied Scientist, Efficient LLM Inference & Model Optimization

Nebius

Palo Alto, California, United States (On-site)$195.2K – $262.2K Yearly

21h ago

Senior C++ Software Engineer (Defense Autonomy)

Applied Intuition

Arlington, Virginia, United States (On-site)$150K – $250K Yearly

2w ago

Principal Deep Learning Communication Architect

NVIDIA

Santa Clara, California, US or Remote (United States)$272K – $431.3K Yearly

Deep Learning Architecture

HPC Engineering

NCCL

UCX

13h ago

Member of Technical Staff, Model Efficiency

Cohere

New York, US or Remote (Worldwide)

Modeling

Machine Learning Engineer

C++

Python

6d ago

Senior Backend Engineer, Inference Platform

Together AI

San Francisco, California, United States (On-site)$160K – $250K Yearly

Backend Engineering

Platform Engineering

Rust

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies
Pricing

For Companies

Post a job
Pricing

Resources

Locations
Salaries
Sitemap

About

About