Home
Jobs
Low-Precision Inference

Low-Precision Inference Jobs

Browse 41 Low-Precision Inference jobs on Inference Jobs.

21-40 of 41 jobs

4w ago

Senior Performance Engineer - LLM Inference Frameworks

NVIDIA

Yokne'am, Northern District, Israel (Hybrid)

Performance Engineering

LLM Inference

Python

PyTorch

3w ago

Inference Intern

Etched

San Jose, California, United States (On-site)

Inference Architecture

AI Accelerator Engineering

Python

C++

1w ago

Member of Technical Staff, Inference

xAI

Palo Alto, California, United States (On-site)$180K – $440K Yearly

Machine Learning Engineer

AI Infrastructure

Rust

C++

3d ago

Staff Software Engineer, Inference

CoreWeave

Warszawa, Masovian Voivodeship, Poland (On-site)zł 369K – zł 542.3K Yearly

Technology

Inference Engineering

Kubernetes

3w ago

Inference Technical Lead, Sora

OpenAI

San Francisco, California, United States (Hybrid)$380K – $380K Yearly

Inference Engineering

AI Infrastructure

GPU Inference

Model Serving

4w ago

Research Intern, Inference (Fall 2026)

Together AI

San Francisco, California, United States (On-site)$58 – $63 Hourly

3w ago

Software Engineer, Inference – AMD GPU Enablement

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

1w ago

Research Engineer, Post-Training Inference

Together AI

San Francisco, California, United States (On-site)$200K – $290K Yearly

Research Engineering

ML Infrastructure Engineering

Python

3w ago

Inference Engineer

Cartesia

San Francisco, California, United States (On-site)$180K – $250K Yearly

Inference Engineering

Machine Learning Engineering

Model Inference

Distributed Systems

2w ago

Research Engineer, Infrastructure, Kernels

Thinking Machines Lab

San Francisco, California, United States (On-site)$350K – $475K Yearly

Machine Learning Infrastructure

AI Research Engineer

CUDA

CuTe

4w ago

Machine Learning Engineer - Inference

Together AI

San Francisco, California, United States (On-site)$160K – $230K Yearly

Machine Learning Engineer

Inference Engineer

Python

PyTorch

3w ago

Audio Inference Engineer, Model Efficiency

Cohere

New York, US or Remote (Canada + 4 more)

AI Infrastructure

Machine Learning Engineer

C++

Python

4w ago

Inference Technical Lead, On-Device Transformers

OpenAI

San Francisco, California, United States (Hybrid)$445K – $445K Yearly

Machine Learning

Inference Engineering

CUDA

ML Runtimes

3w ago

Software Engineer, Model Inference

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

3d ago

Engineering Manager, Inference Benchmarking — AI Perf

NVIDIA

Worldwide (Remote)$224K – $356.5K Yearly

Engineering Management

Performance Engineering

LLM Inference

vLLM

1d ago

Senior Software Engineer, AI Inference Systems

NVIDIA

Toronto, Ontario, Canada (Hybrid)C$170K – C$275K Yearly

3d ago

Senior Software Engineer, AI Inference Systems

NVIDIA

Santa Clara, California, United States (Hybrid)$184K – $356.5K Yearly

3w ago

Software Engineer, Inference - Multi Modal

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

Software Engineer

Inference Engineer

Inference Infrastructure

Multimodal Models

3d ago

Solutions Architect, Inference Deployments

NVIDIA

Santa Clara, California, United States (On-site)$152K – $241.5K Yearly

Solutions Architecture

Generative AI

Kubernetes

TensorRT-LLM

5d ago

Senior Software Engineer, Inference

Anthropic

Dublin, Dublin, Ireland (Hybrid)€235K – €295K Yearly

Software Engineering

Machine Learning Engineering

Distributed Systems

Machine Learning Systems

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies
Pricing

For Companies

Post a job
Pricing

Resources

Locations
Salaries
Sitemap

About

About