Sign in Post a job Sign up

Home
Jobs
Quantization

Quantization Jobs

Browse 15 Quantization jobs on Inference Jobs.

15 jobs

2w ago

FI

Staff AI Inference and Acceleration Engineer

Figure

San Jose, California, United States (On-site)$180K – $275K Yearly

AI/ML Inference Engineering

Hardware Acceleration

AI/ML Inference

3w ago

OP

Research-Hardware Codesign Engineer

OpenAI

San Francisco, California, United States (Hybrid)$185K – $455K Yearly

Hardware Engineering

Machine Learning Research

3w ago

BA

Software Engineer - Model Performance

Baseten

San Francisco, California, US or Remote (Worldwide)$180K – $360K Yearly

Software Engineering

Machine Learning Engineering

3d ago

NV

Senior DL Software Engineer, Model Optimization and Edge Deployment - Autonomous Vehicles

NVIDIA

Santa Clara, California, United States (On-site)$184K – $356.5K Yearly

Deep Learning Engineering

Model Optimization

3w ago

BA

GPU Kernel Engineer

Baseten

San Francisco, California, US or Remote (United States)$180K – $360K Yearly

GPU Kernel Engineering

AI Infrastructure

2w ago

HA

LLM Inference Engineer

Hippocratic AI

Palo Alto, California, United States (On-site)

LLM Engineering

Machine Learning Engineering

Distributed Serving

1w ago

XA

Member of Technical Staff - RL Inference

xAI

Palo Alto, California, United States (On-site)

RL Inference Engineering

ML Infrastructure Engineering

1w ago

MO

Member of Technical Staff - Inference Research

Modal

New York, United States (On-site)$150K – $350K Yearly

ML Infrastructure Engineering

Speculative Decoding

2w ago

NV

Senior Software Engineer, Deep Learning Inference

NVIDIA

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)$150K – $200K Yearly

Deep Learning Inference Engineering

GPU Software Development

2d ago

NV

Senior Quantum Applied Research Scientist, Calibration and Decoding

NVIDIA

United States (Remote)$192K – $304.8K Yearly

Quantum Computing Research

Applied Research Scientist

Quantum Computing

Machine Learning

2w ago

GR

Staff Engineer (ML Engineer)

Graphcore

Bristol, England, United Kingdom (On-site)

Machine Learning Validation

Machine Learning

2w ago

GR

Staff Engineer (ML Engineer)

Graphcore

Cambridge, England, United Kingdom (On-site)

Machine Learning

3w ago

NV

Senior Deep Learning Algorithms Engineer - BioNeMo

NVIDIA

Ho Chi Minh City, Ho Chi Minh City, Vietnam (On-site)

Deep Learning Engineering

AI Infrastructure

2w ago

D-

Principal LLM Inference Engineer

d-Matrix

United States (Remote)$195K – $285K Yearly

LLM Inference Engineering

AI Infrastructure Engineer

3d ago

NV

AI Inference Performance Engineer - New College Grad 2026

NVIDIA

Santa Clara, California, United States (On-site)$124K – $241.5K Yearly

Machine Learning Infrastructure

Related Searches

Performance Engineering

Speculative Decoding

Subscribe to this search

Get email updates when new jobs match this search.

Email address

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies
Pricing

For Companies

Post a job
Pricing

Resources

Locations
Salaries
Sitemap

About

About

© 2026 Inference Jobs. All rights reserved.

Terms of Service Privacy Policy Cookie Policy