Home
Jobs
LLM Inference Optimization

LLM Inference Optimization Jobs

Browse 426 LLM Inference Optimization jobs on Inference Jobs.

261-280 of 426 jobs

1wNV

Senior Software Developer, AI Networking

NVIDIA

Texas, United States (Remote)$184k – $356.5k Yearly

AI Engineer

HPC Engineer

2wAN

Research Compute Operations

Anthropic

San Francisco, California, United States (Hybrid)$270k – $290k Yearly

Compute

MLOps

3wAI

AI Infrastructure Engineer - Autonomy

Applied Intuition

Sunnyvale, California, United States (On-site)$153k – $222k Yearly

AI Infrastructure

Autonomy Software Engineering

3wNV

Software Architect, Advanced Development

NVIDIA

Yokne'am, Northern District, Israel (On-site)

AI Infrastructure

Distributed Systems

2wNV

AI Safety Scientist, Deep Learning

NVIDIA

Ho Chi Minh City, Ho Chi Minh City, Vietnam (On-site)

AI Research

AI Safety

3wNV

Senior Research Scientist, Multi-Modal Language Models

NVIDIA

Santa Clara, California, United States (On-site)$192k – $356.5k Yearly

AI Research

Computer Vision Research

2wDE

Staff Research Engineer

Decagon

San Francisco, California, United States (On-site)$350k – $475k Yearly

AI Research

Engineering

2wLA

Deployed Engineer (EMEA)

LangChain

London, England, United Kingdom (On-site)

Customer Engineering

Deployed Engineering

6dCR

Principal Product Manager, General Compute (SF, Sunnyvale, New York)

Crusoe

San Francisco, California, United States (Hybrid)$260.8k – $326k Yearly

AI Product Management

Cloud Computing

3dNV

Lead Principal Engineer, Enterprise Agentic AI Platform

NVIDIA

Santa Clara, California, United States (On-site)$272k – $431.3k Yearly

AI/ML Engineering

Infrastructure Engineering

1wTE

Software Engineer, Kernel Development and Optimization

Tenstorrent

Gdańsk, Pomeranian Voivodeship, Poland (Hybrid)

HPC Development

Kernel Development

4wXA

Member of Technical Staff, Midtraining

xAI

Palo Alto, California, United States (On-site)$180k – $440k Yearly

AI Research Engineer

Data Engineer

1wAN

[Expression of Interest] Research Scientist/Engineer, Honesty

Anthropic

New York, New York, United States (Hybrid)$315k – $340k Yearly

AI Research & Engineering

AI Research Scientist

2wLA

Deployed Engineer (East)

LangChain

New York, New York, United States (On-site)$150k – $270k Yearly

Customer Engineering

Deployed Engineering

4wNV

Software Product Manager - Nemotron

NVIDIA

Santa Clara, California, United States (On-site)$240k – $379.5k Yearly

AI Product Management

Machine Learning

2wOP

Research Engineer, Frontier Evals & Environments

OpenAI

San Francisco, California, United States (On-site)$200k – $370k Yearly

AI Research

AI Safety

1wNV

Manager, AI Networking Performance Research and Analysis

NVIDIA

Yokneam Ilit, Northern District, Israel (Hybrid)

AI Networking

Hardware Engineering

1wTM

Research Engineer, Infrastructure, Tinker

Thinking Machines Lab

San Francisco, California, United States (On-site)$350k – $475k Yearly

DevOps

Infrastructure Engineering

2wLA

Deployed Engineer (West)

LangChain

San Francisco, California, United States (On-site)$150k – $270k Yearly

AI Engineering

Customer Engineering

2wOP

Research Engineer, Privacy

OpenAI

San Francisco, California, United States (On-site)$380k – $460k Yearly

AI Research

Applied Science

Inference Jobs

Senior Software Developer, AI Networking

Research Compute Operations

AI Infrastructure Engineer - Autonomy

Software Architect, Advanced Development

AI Safety Scientist, Deep Learning

Senior Research Scientist, Multi-Modal Language Models

Staff Research Engineer

Deployed Engineer (EMEA)

Principal Product Manager, General Compute (SF, Sunnyvale, New York)

Lead Principal Engineer, Enterprise Agentic AI Platform

Software Engineer, Kernel Development and Optimization

Member of Technical Staff, Midtraining

[Expression of Interest] Research Scientist/Engineer, Honesty

Deployed Engineer (East)

Software Product Manager - Nemotron

Research Engineer, Frontier Evals & Environments

Manager, AI Networking Performance Research and Analysis

Research Engineer, Infrastructure, Tinker

Deployed Engineer (West)

Research Engineer, Privacy

Related searches