Model Quantization Jobs

AI/ML Inference Engineering

JAX

2w ago

Staff AI Inference and Acceleration Engineer

Figure

San Jose, California, United States (On-site)$180K – $275K Yearly

Hardware Acceleration

AI/ML Inference

ONNX

3w ago

Software Engineer - Model Performance

Baseten

San Francisco, California, US or Remote (Worldwide)$180K – $360K Yearly

Software Engineering

Machine Learning Engineer

2w ago

Staff Engineer, ML Models

Tenstorrent

Cyprus (Hybrid)

Staff Engineer

Machine Learning Research

TensorFlow

3w ago

Software Engineer - Model API's

Baseten

San Francisco, California, US or Remote (Worldwide)$180K – $360K Yearly

3w ago

Research-Hardware Codesign Engineer

OpenAI

San Francisco, California, United States (Hybrid)$185K – $455K Yearly

Hardware Engineering

2w ago

LLM Inference Engineer

Hippocratic AI

Palo Alto, California, United States (On-site)

LLM Engineering

Machine Learning Research

LLM Inference

Distributed Serving

4w ago

Sr. Staff Machine Learning Researcher - Model Training & Optimization

Tenstorrent

Toronto, Ontario, Canada (Hybrid)$100K – $500K Yearly

ML Models

3w ago

Software Engineer, Model Performance Tooling

Baseten

CA or Remote (Canada + 1 more)$160K – $200K Yearly

Software Engineering

Machine Learning Validation

2w ago

Staff Engineer (ML Engineer)

Graphcore

Bristol, England, United Kingdom (On-site)

ML Engineering

Machine Learning

Machine Learning Engineer

3w ago

LLM Inference Frameworks and Optimization Engineer

Together AI

San Francisco, California, United States (On-site)$160K – $230K Yearly

AI Research Engineer

TensorRT-LLM

vLLM

2w ago

Staff Engineer (ML Engineer)

Graphcore

Cambridge, England, United Kingdom (On-site)

4w ago

ML Engineer - Life Sciences (Early Talent)

Nebius

Amsterdam, North Holland, Netherlands (On-site)

Machine Learning Engineer

AI Engineer

Machine Learning

3d ago

Senior Software Engineer - Autonomous Driving

NVIDIA

Santa Clara, California, United States (On-site)$224K – $356.5K Yearly

Senior Software Engineer

Autonomous Driving

C/C++

AI Infrastructure Engineering

2w ago

Senior Software Developer: Models Team (Token Factory)

Nebius

Amsterdam, North Holland, Netherlands (Hybrid)

2w ago

Senior Deep Learning Engineer

NVIDIA

GB or Remote (United Kingdom + 4 more)zł 292.5K – zł 507K Yearly

Deep Learning

Deep Learning

Deep Learning Engineering

3w ago

Senior Deep Learning Algorithms Engineer - BioNeMo

NVIDIA

Ho Chi Minh City, Ho Chi Minh City, Vietnam (On-site)

AI Infrastructure

TensorRT-LLM

CUDA

3w ago

GPU Kernel Engineer

Baseten

San Francisco, California, US or Remote (United States)$180K – $360K Yearly

GPU Kernel Engineering

AI Infrastructure

CUDA