Home
Jobs
Model Parallelization

Model Parallelization Jobs

Browse 522 Model Parallelization jobs on Inference Jobs.

41-60 of 522 jobs

4wD-

Machine Learning Intern - Dynamic KV-Cache Modeling for Efficient LLM Inference

d-Matrix

Campbell, California, United States or Remote (California, United States)$30 – $59 Hourly

AI Research

Data Science

7dTE

Software Engineer

Tenstorrent

東京都, Tokyo Prefecture, Japan (On-site)

Deep Learning

HPC

1wTA

Research Engineer, Frontier Speculative Decoding

Together AI

San Francisco, California, United States (On-site)$190k – $270k Yearly

AI Research Engineer

Applied AI Research

3wNV

Senior Scientific Machine Learning Engineer – Earth-2

NVIDIA

Santa Clara, California, United States (On-site)$152k – $287.5k Yearly

AI Engineer

Computational Scientist

4wNV

CPU Performance Developer Technology Engineer

NVIDIA

Beijing, Beijing, China (On-site)

CPU Engineering

HPC Software Development

7dTM

Research Engineer, Infrastructure, Kernels

Thinking Machines Lab

San Francisco, California, United States (On-site)$350k – $475k Yearly

AI Research Engineer

HPC Engineer

4wCE

Python / PyTorch Developer — Frontend Inference Compiler – Dubai

Cerebras

United Arab Emirates (On-site)

AI Developer

Compiler Engineer

1wNV

Senior Architect - Simulation Kernel Modelling

NVIDIA

Bengaluru, Karnataka, India (Hybrid)

Computer Architecture

GPU Architecture

2wSE

ML Engineer

Sesame

New York, New York, United States (On-site)$190k – $320k Yearly

AI Engineer

LLM Engineering

7dRU

Applied Research Lead, Model Scaling

Runway

New York, New York, United States or Remote (North America + 1 more)$280k – $380k Yearly

AI Research

Applied Research

4wNV

Senior Applied Researcher, Foundational AI Models for Biology

NVIDIA

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)

AI Research

Bioinformatics

2wXA

Member of Technical Staff, World Model

xAI

Palo Alto, California, United States (On-site)$180k – $440k Yearly

AI Research Engineer

Machine Learning Engineer

2wBA

Software Engineer, Model Performance Tooling

Baseten

Canada or Remote (Canada + 1 more)C$130k – C$200k Yearly

AI/ML

DevOps

7dCE

Senior Research Engineer - Inference ML

Cerebras

Sunnyvale, California, United States (Hybrid)

AI Research Engineer

Deep Learning

4dDE

Staff Software Engineer, ML Infrastructure

Decagon

San Francisco, California, United States (On-site)$300k – $430k Yearly

Engineering

Infrastructure Engineering

2wPE

Internship - Machine Learning Research Engineer (Berlin)

Perplexity

Berlin, Berlin, Germany (On-site)

Internship

Machine Learning Engineering

3wTE

C++ Machine Learning Engineer, Models Training

Tenstorrent

Austin, Texas, United States (Hybrid)$100k – $500k Yearly

AI Infrastructure

C++ Developer

7dXA

Member of Technical Staff - Enterprise Model Evaluation

xAI

Palo Alto, California, United States (On-site)$180k – $440k Yearly

AI Research

Data Science

2wCO

Member of Technical Staff, Model Efficiency

Cohere

New York, New York, United States or Remote (New York, United States + 3 more)

AI Research Engineer

Backend Engineer

7dAN

Research Engineer, Production Model Post Training

Anthropic

San Francisco, California, United States (Hybrid)$315k – $340k Yearly

AI Research & Engineering

AI Safety Engineer

Inference Jobs

Machine Learning Intern - Dynamic KV-Cache Modeling for Efficient LLM Inference

Software Engineer

Research Engineer, Frontier Speculative Decoding

Senior Scientific Machine Learning Engineer – Earth-2

CPU Performance Developer Technology Engineer

Research Engineer, Infrastructure, Kernels

Python / PyTorch Developer — Frontend Inference Compiler – Dubai

Senior Architect - Simulation Kernel Modelling

ML Engineer

Applied Research Lead, Model Scaling

Senior Applied Researcher, Foundational AI Models for Biology

Member of Technical Staff, World Model

Software Engineer, Model Performance Tooling

Senior Research Engineer - Inference ML

Staff Software Engineer, ML Infrastructure

Internship - Machine Learning Research Engineer (Berlin)

C++ Machine Learning Engineer, Models Training

Member of Technical Staff - Enterprise Model Evaluation

Member of Technical Staff, Model Efficiency

Research Engineer, Production Model Post Training

Related searches