Home
Jobs
LLM Inference Optimization

LLM Inference Optimization Jobs

Browse 444 LLM Inference Optimization jobs on Inference Jobs.

61-80 of 444 jobs

2wBA

Software Engineer - Model Performance

Baseten

San Francisco, California, United States (On-site)$150k – $250k Yearly

Backend Engineer

Engineering

2wNV

Solutions Architect - Financial Service and Retail

NVIDIA

Beijing, Beijing, China (On-site)

AI Engineering

HPC Architect

6dTA

Machine Learning Engineer - Inference

Together AI

San Francisco, California, United States (On-site)$160k – $230k Yearly

AI Research

Inference Engineer

4wNV

Developer Technology Engineer - AI

NVIDIA

Shanghai, Shanghai, China (On-site)

AI Engineer

Developer Technology Engineer

2wOP

Inference Technical Lead, Sora

OpenAI

San Francisco, California, United States (Hybrid)$380k – $380k Yearly

AI Infrastructure

GPU Engineering

1wTA

Research Engineer, Core ML

Together AI

San Francisco, California, United States (On-site)$200k – $280k Yearly

AI Research

Deep Learning

3wCE

Inference Compiler and Frontend Engineer – Dubai

Cerebras

Dubai, Dubai, United Arab Emirates (On-site)

AI Inference

AI Research

2wNV

Senior Deep Learning Test Development Engineer, SDET

NVIDIA

Shanghai, Shanghai, China (On-site)

Deep Learning QA

SDET

2dNV

Senior Scientist, Synthetic Data and Privacy

NVIDIA

Santa Clara, California, United States (On-site)$192k – $356.5k Yearly

AI Research

Applied Science

4dCR

Research Engineer

Crusoe

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)

AI Infrastructure

AI Research

2wLA

Fullstack Engineer, Applied AI

LangChain

San Francisco, California, United States (On-site)$170k – $195k Yearly

AI Engineering

Engineering

3wNV

Senior Software Engineer - NIM Factory Container and Cloud Infrastructure

NVIDIA

Santa Clara, California, United States (On-site)$184k – $356.5k Yearly

Cloud Infrastructure

DevOps Engineer

6dNV

Senior System Software Engineer - Dynamo-Triton Inference Server

NVIDIA

Santa Clara, California, United States (On-site)$152k – $241.5k Yearly

AI Development

Inference Engineering

6dSC

Senior Forward Deployed Data Scientist/Engineer

Scale

San Francisco, California, United States (Hybrid)$198k – $247.5k Yearly

Artificial Intelligence

Data Engineering

4wSC

Machine Learning Systems Research Engineer, Agent Post-training - Enterprise GenAI

Scale

San Francisco, California, United States (On-site)$252k – $315k Yearly

AI Engineer

LLM Engineer

2wNV

Senior AI Software Engineer, GenAI Framework

NVIDIA

Santa Clara, California, United States (On-site)$152k – $287.5k Yearly

AI Engineering

AI Research

6dAN

Research Engineer, Pretraining Scaling

Anthropic

San Francisco, California, United States (On-site)$315k – $560k Yearly

AI Research

AI Research & Engineering

2wXA

Member of Technical Staff, Grokipedia - Synthetic Data & Epistemics

xAI

Palo Alto, California, United States (On-site)$180k – $440k Yearly

AI Engineer

Backend Engineer

6dNE

GPU Cluster Architect

Nebius

United States (Remote)$150k – $180k Yearly

Hardware Infrastructure

HPC Engineer

6dCO

Principal Engineer, Inference

CoreWeave

Sunnyvale, California, United States (Hybrid)$206k – $303k Yearly

Cloud Engineering

Infrastructure Engineering

Inference Jobs

Software Engineer - Model Performance

Solutions Architect - Financial Service and Retail

Machine Learning Engineer - Inference

Developer Technology Engineer - AI

Inference Technical Lead, Sora

Research Engineer, Core ML

Inference Compiler and Frontend Engineer – Dubai

Senior Deep Learning Test Development Engineer, SDET

Senior Scientist, Synthetic Data and Privacy

Research Engineer

Fullstack Engineer, Applied AI

Senior Software Engineer - NIM Factory Container and Cloud Infrastructure

Senior System Software Engineer - Dynamo-Triton Inference Server

Senior Forward Deployed Data Scientist/Engineer

Machine Learning Systems Research Engineer, Agent Post-training - Enterprise GenAI

Senior AI Software Engineer, GenAI Framework

Research Engineer, Pretraining Scaling

Member of Technical Staff, Grokipedia - Synthetic Data & Epistemics

GPU Cluster Architect

Principal Engineer, Inference

Related searches