Home
Jobs
Model Optimization

Model Optimization Jobs

Browse 35 Model Optimization jobs on Inference Jobs.

35 jobs

4w ago

Sr. Staff Machine Learning Researcher - Model Training & Optimization

Tenstorrent

Toronto, Ontario, Canada (Hybrid)$100K – $500K Yearly

ML Models

Machine Learning Research

Python

PyTorch

3w ago

Staff Research Engineer, Model Efficiency

Cohere

New York, US or Remote (Worldwide)

Modeling

Machine Learning

Model Architecture

3d ago

Senior DL Software Engineer, Model Optimization and Edge Deployment - Autonomous Vehicles

NVIDIA

Santa Clara, California, United States (On-site)$184K – $356.5K Yearly

Deep Learning Engineering

Model Optimization

PyTorch

JAX

2w ago

Power Optimization Engineer

Etched

Cupertino, California, United States (On-site)

3w ago

Engineering Manager - Model Performance

Baseten

San Francisco, California, US or Remote (California, United States + 1 more)$260K – $380K Yearly

Engineering Management

ML Engineering

Python

C++

3w ago

Member of Technical Staff, Model Efficiency

Cohere

New York, US or Remote (Worldwide)

Modeling

Machine Learning Engineer

C++

Python

4w ago

Research Intern, Model Shaping (Fall 2026)

Together AI

San Francisco, California, United States (On-site)$58 – $63 Hourly

3w ago

Software Engineer, Inference - Performance Optimization

OpenAI

San Francisco, California, United States (On-site)$295K – $555K Yearly

Scaling

Inference

Performance Profiling

Benchmarking

3w ago

LLM Inference Frameworks and Optimization Engineer

Together AI

San Francisco, California, United States (On-site)$160K – $230K Yearly

Machine Learning Engineer

AI Research Engineer

TensorRT-LLM

vLLM

3w ago

ML Model Serving Engineer

Sesame

San Francisco, California, United States (On-site)$175K – $280K Yearly

Machine Learning Engineer

AI Engineer

PyTorch

vLLM

3d ago

Lead Performance Modeling Architect, CPU Fabric and LLC

NVIDIA

Santa Clara, California, United States (On-site)$184K – $356.5K Yearly

Performance Architecture

CPU Architecture

Performance Modeling

Cache Coherency Protocols

3w ago

Performance Modeling Engineer

Etched

San Jose, California, United States (On-site)$175K – $275K Yearly

Performance Engineering

Computer Architecture

Performance Modeling

Computer Architecture

3d ago

Senior Architecture Energy Modeling Engineer

NVIDIA

Santa Clara, California, United States (On-site)$168K – $310.5K Yearly

Hardware Engineering

Computer Architecture

Python

C++

4w ago

Software Engineer, Kernel Development and Optimization

Tenstorrent

Gdańsk, Pomeranian Voivodeship, Poland (Hybrid)

Kernel Development

GPU Kernel Optimization

C++

Kernel Development

1w ago

Researcher, Training - London

OpenAI

London, England, United Kingdom (Hybrid)£170K – £445K Yearly

LLM Research

Machine Learning Research

LLM Architectures

Long-context

2w ago

Developer Relations Manager, cuOpt and Graph Optimization

NVIDIA

Beijing, Beijing, China (On-site)

Developer Relations

cuOpt

GPU Accelerated Computing

cuOpt

3d ago

Solutions Architect, Pre-training and Post-training

NVIDIA

Seoul, Seoul, South Korea (On-site)

Solutions Architect

AI Solutions Architect

Megatron-LM

Megatron-Bridge

3w ago

Performance Modeling Lead

OpenAI

San Francisco, California, United States (Hybrid)$342K – $555K Yearly

Scaling

Hardware

Performance Modeling

Modeling Frameworks and Toolchains

1d ago

Solutions Architect, Agentic Optimization

NVIDIA

United States (Remote)$152K – $241.5K Yearly

Solutions Architect

AI Solutions Architect

Python

C++

3d ago

Senior Power Analysis and Optimization Engineer, AI-LLM Systems

NVIDIA

Santa Clara, California, United States (On-site)$136K – $264.5K Yearly

Power Analysis Engineer

AI/ML Engineer

Power Analysis

RTL Design

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies
Pricing

For Companies

Post a job
Pricing

Resources

Locations
Salaries
Sitemap

About

About