Inference Jobs

Jobs Companies

Home
Jobs
United States
Low Latency Optimization

Low Latency Optimization Jobs in United States

Discover Low Latency Optimization roles in United States on Inference Jobs and apply today.

1mo agoMA

Member of Technical Staff, Inference & RL Systems

Magic

San Francisco, California, United States (On-site)$225K – $550K Yearly

Machine Learning Engineer

Software Engineer

Distributed Systems

Reinforcement Learning

2mo agoNV

Senior Applied Deep Learning Research Scientist, Efficiency

NVIDIA

Santa Clara, California, United States (On-site)$192K – $356.5K Yearly

Deep Learning Research

Applied Science

Deep Learning

Python

3w agoTM

Research Engineer, Infrastructure, Kernels

Thinking Machines Lab

San Francisco, California, United States (On-site)$350K – $475K Yearly

Machine Learning Infrastructure

AI Research Engineer

CUDA

CuTe

3d agoNV

Senior Deep Learning Software Engineer, LLM Performance

NVIDIA

Santa Clara, California, United States (On-site)$184K – $356.5K Yearly

Deep Learning Engineering

LLM Performance Engineering

Python

C++

3w agoET

Front-End Power Engineer

Etched

Cupertino, California, United States (On-site)

3w agoAN

Senior / Staff+ Software Engineer, Voice Platform

Anthropic

San Francisco, California, United States (Hybrid)$320K – $485K Yearly

Software Engineering - Infrastructure

Platform Engineering

Distributed Systems

Real-time Infrastructure

3mo agoCO

Audio Inference Engineer, Model Efficiency

Cohere

New York, United States or Remote (New York, United States + 3 more)

AI Infrastructure

Machine Learning Engineer

C++

Python

5d agoCE

Senior Performance Analyst, Inference

Cerebras

Sunnyvale, California, United States (On-site)

3mo agoCE

Senior Runtime Engineer

Cerebras

Sunnyvale, California, United States (On-site)

4d agoCE

Data Center - Network Fiber Engineer

Cerebras

United States (Remote)$250K – $290K Yearly

Network Engineering

Fiber Engineering

Network Engineering

5d agoCE

Engineering Lead, Inference Platform

Cerebras

Sunnyvale, California, United States (On-site)

Platform Engineering

Backend Engineering

C++

2mo agoTE

RISC-V AI / HPC & Agentic Software Engineering Lead

Tenstorrent

North America (Remote)$100K – $500K Yearly

2w agoQD

Senior Solutions Engineer (Bay Area)

Qdrant

San Francisco, California, United States (Hybrid)$180K – $225K Yearly

Solutions Engineering

Sales Engineering

Vector Search

Rust

3w agoTM

Research, Audio Expertise

Thinking Machines Lab

San Francisco, California, United States (On-site)$350K – $475K Yearly

Machine Learning Research

AI Research

Python

PyTorch

3d agoTE

AI Subsystems Physical Design Lead

Tenstorrent

Austin, Texas, United States (Hybrid)$100K – $500K Yearly

Physical Design Engineer

ASIC Design

Physical Design

Synthesis

3mo agoBA

Software Engineer - Model Performance

Baseten

San Francisco, California, United States (On-site)$150K – $250K Yearly

3mo agoBA

Engineering Manager - Model Performance

Baseten

San Francisco, California, United States (On-site)$230K – $300K Yearly

Engineering Management

ML Engineering

Python

C++

1mo agoTE

Sr. RTL Design Engineer - Tensix

Tenstorrent

Austin, Texas, United States (Hybrid)$100K – $500K Yearly

2mo agoNV

Senior Performance Engineer - Deep Learning

NVIDIA

Santa Clara, California, United States (On-site)$152K – $241.5K Yearly

3mo agoOP

Inference Technical Lead, Sora

OpenAI

San Francisco, California, United States (Hybrid)$380K – $380K Yearly

Inference Engineering

AI Infrastructure

Inference

GPU Computing

Subscribe to this search

Get email updates when new jobs match this search.

Email address

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies

For Companies

Post a job

Resources

Locations
Salaries
Sitemap

About

About