Home
Jobs
LLM Inference Optimization

LLM Inference Optimization Jobs

Browse 452 LLM Inference Optimization jobs on Inference Jobs.

101-120 of 452 jobs

4wCE

ML API Features SDET

Cerebras

Sunnyvale, California, United States (Hybrid)

Machine Learning Engineer

QA Engineer

2wSC

Tech Lead Manager, Machine Learning Research Scientist- LLM Evals

Scale

San Francisco, California, United States (On-site)$280k – $380k Yearly

AI Research

LLM Evaluation

7dAN

Research Engineer, Pretraining Scaling (London)

Anthropic

London, England, United Kingdom (On-site)£250k – £435k Yearly

AI Research & Engineering

AI Safety

3dAN

Research Engineer / Research Scientist, Pretraining

Anthropic

Zürich, Zürich, Switzerland (Hybrid)

AI Research & Engineering

Deep Learning

3wNV

Platform Architecture Engineer, GeForce NOW

NVIDIA

Santa Clara, California, United States (On-site)$184k – $287.5k Yearly

Cloud Architecture

GPU Computing

7dCE

Principal ML Investigator

Cerebras

Sunnyvale, California, United States (On-site)

AI Research

Applied Science

1wNE

Senior Technical Product Manager Token Factory - Inference

Nebius

United States (Remote)$204k – $255k Yearly

AI Product Management

Machine Learning Infrastructure

2dNV

Senior Deep Learning Compiler Engineer - XLA

NVIDIA

Santa Clara, California, United States (On-site)$152k – $241.5k Yearly

AI Compiler

Compiler Engineering

2wOP

Software Engineer, Productivity

OpenAI

San Francisco, California, United States (On-site)$255k – $405k Yearly

Developer Experience

DevOps

7dNV

Senior LLM Agents Architect

NVIDIA

Yokneam Ilit, Northern District, Israel (Hybrid)

AI Architect

LLM Engineer

7dAN

Staff Research Engineer, Discovery Team

Anthropic

San Francisco, California, United States (Hybrid)$340k – $425k Yearly

AI Research

AI Safety Research

7dXA

Member of Technical Staff, RL Training Framework

xAI

Palo Alto, California, United States (On-site)$180k – $440k Yearly

AI Engineer

Backend Engineer

4dNV

Senior AI Compiler Engineer, MLIR

NVIDIA

Santa Clara, California, United States (On-site)$152k – $241.5k Yearly

AI Engineering

Compiler Engineering

6dAN

Engineering Manager, Inference

Anthropic

San Francisco, California, United States (Hybrid)$425k – $560k Yearly

AI Engineering

AI Research & Engineering

2wMA

Software Engineer, Technical Lead, Inference

Mistral AI

Île de Ré, Charente-Maritime, France (Hybrid)

AI Infrastructure

Backend Development

6dLA

Applied Research Engineer, Agents

Labelbox

San Francisco, California, United States (Hybrid)$250k – $300k Yearly

AI Research

AI/ML

7dXA

Member of Technical Staff - Reasoning Efficiency

xAI

Palo Alto, California, United States (On-site)$180k – $440k Yearly

Artificial Intelligence

Deep Learning

3wSC

Staff Machine Learning Research Scientist, LLM Evals

Scale

San Francisco, California, United States (On-site)$280k – $380k Yearly

AI Research Scientist

Applied Scientist

7dVA

GPU Systems Engineer – HPC / Parallel Computing

Vast.ai

San Francisco, California, United States (On-site)$160k – $320k Yearly

AI Infrastructure

GPU Computing

7dAN

Research Engineer, Discovery

Anthropic

San Francisco, California, United States (Hybrid)$340k – $425k Yearly

AI Discovery Research

AI Research & Engineering

Inference Jobs

ML API Features SDET

Tech Lead Manager, Machine Learning Research Scientist- LLM Evals

Research Engineer, Pretraining Scaling (London)

Research Engineer / Research Scientist, Pretraining

Platform Architecture Engineer, GeForce NOW

Principal ML Investigator

Senior Technical Product Manager Token Factory - Inference

Senior Deep Learning Compiler Engineer - XLA

Software Engineer, Productivity

Senior LLM Agents Architect

Staff Research Engineer, Discovery Team

Member of Technical Staff, RL Training Framework

Senior AI Compiler Engineer, MLIR

Engineering Manager, Inference

Software Engineer, Technical Lead, Inference

Applied Research Engineer, Agents

Member of Technical Staff - Reasoning Efficiency

Staff Machine Learning Research Scientist, LLM Evals

GPU Systems Engineer – HPC / Parallel Computing

Research Engineer, Discovery

Related searches