Home
Jobs
Model Parallelization

Model Parallelization jobs

Explore Model Parallelization roles on Inference Jobs and apply today.

481-500 of 592 jobs

OP2w

Researcher, Health AI

OpenAI · San Francisco, California, United States (Hybrid) · $310k – $460k Yearly

OpenAI

San Francisco, California, United States (Hybrid)

$310k – $460k Yearly

NV3d

Principal GPU Memory Architect

NVIDIA · Santa Clara, California, United States (On-site) · $272k – $431.3k Yearly

NVIDIA

Santa Clara, California, United States (On-site)

$272k – $431.3k Yearly

NV4w

Deep Learning Algorithm Engineer - New College Grad 2026

NVIDIA · Santa Clara, California, United States (On-site) · $124k – $241.5k Yearly

NVIDIA

Santa Clara, California, United States (On-site)

$124k – $241.5k Yearly

OP2w

Forward Deployed Engineer - Singapore

OpenAI · Singapore, Singapore (Hybrid)

OpenAI

Singapore, Singapore (Hybrid)

NV1w

Senior System Software Engineer - Dynamo-Triton Inference Server

NVIDIA · Santa Clara, California, United States (On-site) · $152k – $241.5k Yearly

NVIDIA

Santa Clara, California, United States (On-site)

$152k – $241.5k Yearly

OP2w

Forward Deployed Engineer (FDE) - NYC

OpenAI · New York, New York, United States (Hybrid) · $180k – $280k Yearly

OpenAI

New York, New York, United States (Hybrid)

$180k – $280k Yearly

PL2w

Research Scientist, Condensed Matter Theory

Periodic Labs · Franklin, Louisiana, United States or Remote (United States)

Periodic Labs

Franklin, Louisiana, United States or Remote (United States)

NV2w

Director, Engineering – Software Engineering and AI Inferencing Platforms

NVIDIA · Hanoi, Hanoi, Vietnam (On-site)

NVIDIA

Hanoi, Hanoi, Vietnam (On-site)

VE1w

AI/ML Computational Theory Lead

Vertiv · Delaware, Ohio, United States (On-site)

Vertiv

Delaware, Ohio, United States (On-site)

NV2w

PhD Intern, AI ML in Wireless L1/L2 - Spring 2026

NVIDIA · Bengaluru, Karnataka, India (On-site)

NVIDIA

Bengaluru, Karnataka, India (On-site)

RU12h

Strategic Finance

Runway · United States (Remote) · $150k – $200k Yearly

Runway

United States (Remote)

$150k – $200k Yearly

12h

NV2w

GPU Power Architect - New College Grad 2026

NVIDIA · Santa Clara, California, United States (On-site) · $100k – $189.8k Yearly

NVIDIA

Santa Clara, California, United States (On-site)

$100k – $189.8k Yearly

CO2w

Solutions Architect

Cohere · Toronto, Ontario, Canada or Remote (Canada + 3 more)

Cohere

Toronto, Ontario, Canada or Remote (Canada + 3 more)

RA2w

Member of Technical Staff - Evaluations

Reflection AI · San Francisco, California, United States (On-site)

Reflection AI

San Francisco, California, United States (On-site)

MA1w

Technical Program Manager, Science Operations - Paris

Mistral AI · Île de Ré, Charente-Maritime, France (Hybrid)

Mistral AI

Île de Ré, Charente-Maritime, France (Hybrid)

TE1w

Power Architect

Tenstorrent · Toronto, Ontario, Canada (Hybrid)

Tenstorrent

Toronto, Ontario, Canada (Hybrid)

XA1w

Member of Technical Staff - Reasoning Post-training

xAI · Palo Alto, California, United States (On-site) · $180k – $440k Yearly

xAI

Palo Alto, California, United States (On-site)

$180k – $440k Yearly

NV5d

Senior Deep Learning Research Engineer

NVIDIA · Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)

NVIDIA

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)

XA1w

Member of Technical Staff, RL Training Framework

xAI · Palo Alto, California, United States (On-site) · $180k – $440k Yearly

xAI

Palo Alto, California, United States (On-site)

$180k – $440k Yearly

GR3w

Senior Staff Engineer

Graphcore · Bristol, England, United Kingdom (On-site)

Graphcore

Bristol, England, United Kingdom (On-site)

Inference Jobs

Researcher, Health AI

Principal GPU Memory Architect

Deep Learning Algorithm Engineer - New College Grad 2026

Forward Deployed Engineer - Singapore

Senior System Software Engineer - Dynamo-Triton Inference Server

Forward Deployed Engineer (FDE) - NYC

Research Scientist, Condensed Matter Theory

Director, Engineering – Software Engineering and AI Inferencing Platforms

AI/ML Computational Theory Lead

PhD Intern, AI ML in Wireless L1/L2 - Spring 2026

Strategic Finance

GPU Power Architect - New College Grad 2026

Solutions Architect

Member of Technical Staff - Evaluations

Technical Program Manager, Science Operations - Paris

Power Architect

Member of Technical Staff - Reasoning Post-training

Senior Deep Learning Research Engineer

Member of Technical Staff, RL Training Framework

Senior Staff Engineer

Related searches