Home
Jobs
LLM Infrastructure

LLM Infrastructure Jobs

Browse 1,012 LLM Infrastructure jobs on Inference Jobs.

81-100 of 1,012 jobs

2wOP

Backend Software Engineer (Evals) – Support Automation Engineering

OpenAI

San Francisco, California, United States (On-site)$255k – $405k Yearly

AI Infrastructure

Applied AI

6dBA

Software Engineer — GPU Networking & Distributed Systems

Baseten

San Francisco, California, United States (On-site)$150k – $250k Yearly

AI Infrastructure

Distributed Systems

1wCE

Full Stack LLM Engineer

Cerebras

Toronto, Ontario, Canada (On-site)

AI Engineering

Compiler Engineer

4wD-

Machine Learning Intern - Dynamic KV-Cache Modeling for Efficient LLM Inference

d-Matrix

Campbell, California, United States or Remote (California, United States)$30 – $59 Hourly

AI Research

Data Science

2wD-

Senior Staff ML Researcher - LLM Algorithmic Optimization

d-Matrix

Bengaluru, Karnataka, India (Hybrid)₹4M – ₹6M Yearly

AI Research

Algorithms

2wNV

Senior Software Engineer – TensorRT Edge-LLM

NVIDIA

Santa Clara, California, United States (Hybrid)$152k – $287.5k Yearly

AI Engineering

Embedded Software

2wCE

Senior Full Stack LLM Engineer - Training

Cerebras

Sunnyvale, California, United States (On-site)

AI Research

Compiler Engineering

2wSC

Tech Lead Manager, Machine Learning Research Scientist- LLM Evals

Scale

San Francisco, California, United States (On-site)$280k – $380k Yearly

AI Research

LLM Evaluation

1wNV

Senior LLM Agents Architect

NVIDIA

Yokneam Ilit, Northern District, Israel (Hybrid)

AI Architect

LLM Engineer

5dNV

Principal Software Engineer - AI Inference

NVIDIA

Santa Clara, California, United States (On-site)$272k – $431.3k Yearly

AI Engineering

Infrastructure Engineering

7dNV

Senior Research Scientist, Fundamental LLM Research for Knowledge, Reasoning, and Agents

NVIDIA

Santa Clara, California, United States (On-site)$224k – $356.5k Yearly

AI Research

Deep Learning Research

2wSE

ML Engineer

Sesame

New York, New York, United States (On-site)$190k – $320k Yearly

AI Engineer

LLM Engineering

2wPE

AI Inference Engineer (San Francisco)

Perplexity

San Francisco, California, United States (On-site)$210k – $385k Yearly

AI Engineering

2wNV

Senior AI Software Engineer, GenAI Framework

NVIDIA

Santa Clara, California, United States (On-site)$152k – $287.5k Yearly

AI Engineering

AI Research

3wSC

Staff Machine Learning Research Scientist, LLM Evals

Scale

San Francisco, California, United States (On-site)$280k – $380k Yearly

AI Research Scientist

Applied Scientist

2wCO

Staff Research Engineer, Model Efficiency

Cohere

New York, New York, United States (Hybrid)

AI Research

Deep Learning

2wSC

Senior/Staff Machine Learning Engineer, General Agents, Enterprise GenAI

Scale

San Francisco, California, United States (On-site)$218k – $273k Yearly

AI Engineer

Enterprise AI

2wLA

Python OSS Engineer

LangChain

San Francisco, California, United States (On-site)$160k – $225k Yearly

Backend Development

LLM Engineering

2wLA

Deployed Engineer (EMEA)

LangChain

London, England, United Kingdom (On-site)

Customer Engineering

Deployed Engineering

1wAN

Startups Solutions Architect, Applied AI

Anthropic

San Francisco, California, United States (Hybrid)$240k – $270k Yearly

AI Engineering

Pre-Sales

Inference Jobs

Backend Software Engineer (Evals) – Support Automation Engineering

Software Engineer — GPU Networking & Distributed Systems

Full Stack LLM Engineer

Machine Learning Intern - Dynamic KV-Cache Modeling for Efficient LLM Inference

Senior Staff ML Researcher - LLM Algorithmic Optimization

Senior Software Engineer – TensorRT Edge-LLM

Senior Full Stack LLM Engineer - Training

Tech Lead Manager, Machine Learning Research Scientist- LLM Evals

Senior LLM Agents Architect

Principal Software Engineer - AI Inference

Senior Research Scientist, Fundamental LLM Research for Knowledge, Reasoning, and Agents

ML Engineer

AI Inference Engineer (San Francisco)

Senior AI Software Engineer, GenAI Framework

Staff Machine Learning Research Scientist, LLM Evals

Staff Research Engineer, Model Efficiency

Senior/Staff Machine Learning Engineer, General Agents, Enterprise GenAI

Python OSS Engineer

Deployed Engineer (EMEA)

Startups Solutions Architect, Applied AI

Related searches