Home
Jobs
Quantization-Aware Distillation

Quantization-Aware Distillation Jobs

Browse 39 Quantization-Aware Distillation jobs on Inference Jobs.

21-39 of 39 jobs

2wD-

ML Compiler Architect, Senior Principal

d-Matrix

Toronto, Ontario, Canada (Hybrid)

Compiler Engineering

Machine Learning Compiler

2wBA

Software Engineer - Model Performance

Baseten

San Francisco, California, United States (On-site)$150k – $250k Yearly

Backend Engineer

Engineering

4wNV

Research Scientist, AI Accelerator SW HW Co-Design - New College Grad 2026

NVIDIA

Santa Clara, California, United States (On-site)$168k – $264.5k Yearly

AI Research

ASIC Engineering

2wPL

Research Engineer - Midtraining

Periodic Labs

Menlo Park, California, United States (On-site)

AI Research Engineer

Deep Learning

3dDE

Staff Software Engineer, ML Infrastructure

Decagon

San Francisco, California, United States (On-site)$300k – $430k Yearly

Engineering

Infrastructure Engineering

6dCE

LLM Inference Performance & Evals Engineer

Cerebras

Toronto, Ontario, Canada (On-site)

AI Infrastructure

LLM Engineering

2wNV

Senior Research Scientist, AI Accelerator Design and VLSI

NVIDIA

Santa Clara, California, United States (On-site)$192k – $356.5k Yearly

AI Hardware

Hardware Engineering

2wOP

Research-Hardware Codesign Engineer

OpenAI

San Francisco, California, United States (Hybrid)$230k – $460k Yearly

Hardware Engineering

Machine Learning Research

6dOP

Research Engineer / Machine Learning Engineer - B2B Applications

OpenAI

San Francisco, California, United States (On-site)$295k – $445k Yearly

AI Research

Applied AI

6dMA

Future AI Global leaders - Applied Science

Mistral AI

Île de Ré, Charente-Maritime, France (On-site)

AI Engineering

AI Research

6dNE

ML Engineer, Large Language Models (LLM Training & Inference Optimization)

Nebius

Europe (Remote)

AI Engineer

Deep Learning

1wTA

Research Engineer, Frontier Speculative Decoding

Together AI

San Francisco, California, United States (On-site)$190k – $270k Yearly

AI Research Engineer

Applied AI Research

2wPO

Member of Engineering (Pre-training / Data)

Poolside

United Kingdom or Remote (Europe, Middle East, and Africa, North America)

AI Research Engineer

AI Researcher

6dTM

Research Engineer, Infrastructure, Numerics

Thinking Machines Lab

San Francisco, California, United States (On-site)$350k – $475k Yearly

AI Research Engineer

Deep Learning Engineer

2wNV

Senior Software Engineer – TensorRT Edge-LLM

NVIDIA

Santa Clara, California, United States (Hybrid)$152k – $287.5k Yearly

AI Engineering

Embedded Software

2wPE

Internship - Machine Learning Research Engineer (Berlin)

Perplexity

Berlin, Berlin, Germany (On-site)

Internship

Machine Learning Engineering

1dNV

Senior Deep Learning Compiler Engineer - XLA

NVIDIA

Santa Clara, California, United States (On-site)$152k – $241.5k Yearly

AI Compiler

Compiler Engineering

2wRA

Member of Technical Staff - Data Quality Engineer (Pre-training)

Reflection AI

San Francisco, California, United States (On-site)

AI Research Engineer

Data Engineering

2wPE

Software Engineer - Data Flywheel

Perplexity

London, England, United Kingdom (On-site)$210k – $385k Yearly

Analytics Engineer

Backend Engineer

Inference Jobs

ML Compiler Architect, Senior Principal

Software Engineer - Model Performance

Research Scientist, AI Accelerator SW HW Co-Design - New College Grad 2026

Research Engineer - Midtraining

Staff Software Engineer, ML Infrastructure

LLM Inference Performance & Evals Engineer

Senior Research Scientist, AI Accelerator Design and VLSI

Research-Hardware Codesign Engineer

Research Engineer / Machine Learning Engineer - B2B Applications

Future AI Global leaders - Applied Science

ML Engineer, Large Language Models (LLM Training & Inference Optimization)

Research Engineer, Frontier Speculative Decoding

Member of Engineering (Pre-training / Data)

Research Engineer, Infrastructure, Numerics

Senior Software Engineer – TensorRT Edge-LLM

Internship - Machine Learning Research Engineer (Berlin)

Senior Deep Learning Compiler Engineer - XLA

Member of Technical Staff - Data Quality Engineer (Pre-training)

Software Engineer - Data Flywheel

Related searches

LLM Inference Performance & Evals Engineer