Home
Jobs
LLM Inference Optimization

LLM Inference Optimization Jobs

Browse 445 LLM Inference Optimization jobs on Inference Jobs.

361-380 of 445 jobs

2wLA

JavaScript Engineer (Open Source Team)

LangChain

San Francisco, California, United States (On-site)$150k – $225k Yearly

JavaScript Developer

Machine Learning Engineer

6dGR

2026 Graduate Software Engineer - Triton

Graphcore

Bristol, England, United Kingdom (On-site)

Compiler Engineering

Graduate Software Engineer

6dAN

Research Engineer, Machine Learning (Horizons)

Anthropic

San Francisco, California, United States (Hybrid)$280k – $425k Yearly

AI Research

AI Research & Engineering

1wSC

Machine Learning Engineer - Model Evaluations, Public Sector

Scale

San Francisco, California, United States (On-site)$216.3k – $300.3k Yearly

AI Engineer

Machine Learning Engineer

3wCR

Engineering Manager, Managed AI

Crusoe

San Francisco, California, United States (On-site)$237.6k – $288k Yearly

AI Infrastructure

Cloud Engineering

2wCO

Member of Technical Staff - Sovereign AI

Cohere

Canada or Remote (Canada)

AI Research Scientist

Applied Scientist

3dNV

Senior Software Engineer - Developer Tools for Deep Learning

NVIDIA

Westford, Massachusetts, United States (On-site)$152k – $287.5k Yearly

AI Engineering

Deep Learning

3wHA

Senior Forward Deployed Engineer

Harvey

New York, New York, United States (On-site)$200k – $260k Yearly

AI Engineer

Engineering

3dD-

Software Engineering Intern - Kernels

d-Matrix

Ontario, Canada (Remote)C$40 – C$70 Hourly

High-Performance Computing

Kernel Development

2wBR

Open Source Engineer - Go

Braintrust

San Francisco, California, United States or Remote (United States)

Backend Engineer

Developer Tools Engineer

6dTM

Research, Post-Training Data

Thinking Machines Lab

San Francisco, California, United States (On-site)$350k – $475k Yearly

AI Research

Applied Science

6dNE

HPC System Engineer

Nebius

Amsterdam, North Holland, Netherlands (On-site)

DevOps

HPC Engineering

2wFU

Senior AI Engineer - Agent Team

FurtherAI

San Francisco, California, United States (On-site)$225k – $300k Yearly

AI Engineer

Applied AI

2wLA

Senior Technical Support Engineer

LangChain

United States (On-site)$130k – $170k Yearly

Customer Support

DevOps

2wSC

Machine Learning Fellow - Human Frontier Collective (Canada)

Scale

Canada (Remote)Up to $80 Hourly

AI Researcher

Data Scientist

4dMO

Forward Deployed ML Engineer

Modal

New York, New York, United States (On-site)$180k – $250k Yearly

Forward Deployed Engineer

Machine Learning Engineer

3wNV

Senior Technical Program Manager, Deep Learning Libraries

NVIDIA

Santa Clara, California, United States (On-site)$168k – $322k Yearly

AI/ML

Deep Learning

5dCE

Compiler Engineer

Cerebras

Sunnyvale, California, United States (On-site)

AI Infrastructure

Backend Development

3dFU

AI Engineer - Agent Team

FurtherAI

San Francisco, California, United States (On-site)$150k – $250k Yearly

AI Engineering

Applied AI

23hNV

Devtech Compute Engineer

NVIDIA

Beijing, Beijing, China (On-site)

C++ Developer

CUDA Engineer

Inference Jobs

JavaScript Engineer (Open Source Team)

2026 Graduate Software Engineer - Triton

Research Engineer, Machine Learning (Horizons)

Machine Learning Engineer - Model Evaluations, Public Sector

Engineering Manager, Managed AI

Member of Technical Staff - Sovereign AI

Senior Software Engineer - Developer Tools for Deep Learning

Senior Forward Deployed Engineer

Software Engineering Intern - Kernels

Open Source Engineer - Go

Research, Post-Training Data

HPC System Engineer

Senior AI Engineer - Agent Team

Senior Technical Support Engineer

Machine Learning Fellow - Human Frontier Collective (Canada)

Forward Deployed ML Engineer

Senior Technical Program Manager, Deep Learning Libraries

Compiler Engineer

AI Engineer - Agent Team

Devtech Compute Engineer

Related searches