Home
Jobs
Model Parallelism

Model Parallelism Jobs

Explore Model Parallelism roles on Inference Jobs and apply today.

3mo agoCA

Inference Engineer

Cartesia

San Francisco, California, United States (On-site)$180K – $250K Yearly

Inference Engineering

Machine Learning Engineering

Model Inference

Distributed Systems

3mo agoD-

Machine Learning Intern - Dynamic KV-Cache Modeling for Efficient LLM Inference

d-Matrix

Santa Clara, Ca, Ca, United States or Remote (California, United States)$30 – $59 Hourly

Machine Learning Intern

AI Research

Machine Learning

Large Language Models (LLM)

2w agoTE

Staff Engineer, ML Models

Tenstorrent

Cyprus (Hybrid)

Machine Learning Engineer

Staff Engineer

PyTorch

TensorFlow

3mo agoCO

Staff Research Engineer, Model Efficiency

Cohere

New York, United States (Hybrid)

Modeling

Machine Learning

Model Architecture

3mo agoBA

Software Engineer, Model Performance Tooling

Baseten

Canada or Remote (Canada + 1 more)C$130K – C$200K Yearly

Software Engineering

Machine Learning Engineering

Python

C++

3mo agoOP

Software Engineer, Model Inference

OpenAI

San Francisco, California, United States (On-site)$325K – $490K Yearly

3w agoTA

Systems Research Engineer, GPU Programming

Together AI

San Francisco, California, United States (Hybrid)$160K – $230K Yearly

AI Research

Machine Learning Engineering

GPU Programming

CUDA

3w agoET

Performance Modeling Engineer

Etched

Cupertino, California, United States (On-site)

Hardware Engineering

Performance Engineering

ASIC Design

Computer Architecture

3w agoCO

Product Manager, Agent Harness & Modelling

Cohere

Toronto, Ontario, Canada (Hybrid)

Product Management

AI Product Management

Agentic AI Systems

LLM Agent Architectures

3mo agoTE

C++ Machine Learning Engineer, Models Training

Tenstorrent

Warszawa, Masovian Voivodeship, Poland (Hybrid)

Machine Learning Engineer

Software Engineering

C++

Machine Learning

3mo agoBA

Senior Software Engineer - Model Training

Baseten

San Francisco, California, United States (On-site)$200K – $275K Yearly

3mo agoNV

Architecture Energy Modeling Engineer

NVIDIA

Shanghai, Shanghai, China (Hybrid)

3mo agoBA

Software Engineer - Model Performance

Baseten

San Francisco, California, United States (On-site)$150K – $250K Yearly

6d agoNV

Solutions Architect - Top AI Labs

NVIDIA

Beijing, Beijing, China (On-site)

Solutions Architecture

AI Engineering

LLM Inference

vLLM

2mo agoNV

Senior AI Developer Technology Engineer, Financial Sector

NVIDIA

Santa Clara, California, United States (Hybrid)$152K – $241.5K Yearly

AI Engineer

Developer Technology Engineer

Data Analytics

2mo agoGR

2026 Graduate Software Engineer - Neuro Engine Modelling

Graphcore

Bristol, England, United Kingdom (On-site)

Software Engineer

Graduate Software Engineer

C++

Python

3mo agoOP

Software Engineer, Platform Systems

OpenAI

London, England, GB

1w agoNV

Senior Deep Learning Solution Architect

NVIDIA

Beijing, Beijing, China (On-site)

Deep Learning

Solution Architecture

Deep Learning

LLM Inference

2mo agoNV

Senior GPU Functional Modeling Architect

NVIDIA

Santa Clara, California, United States (On-site)$152K – $287.5K Yearly

GPU Architecture

Computer Architecture

GPU Architecture

Computer Architecture

3mo agoCO

Member of Technical Staff, Model Efficiency

Cohere

New York, United States or Remote (New York, United States + 3 more)

Modeling

Machine Learning Engineer

C++

Python

Subscribe to this search

Get email updates when new jobs match this search.

Email address

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies

For Companies

Post a job

Resources

Locations
Salaries
Sitemap

About

About