Home
Jobs
LLM Serving Frameworks

LLM Serving Frameworks Jobs

Browse 415 LLM Serving Frameworks jobs on Inference Jobs.

101-120 of 415 jobs

3wCE

Engineering Manager, Inference Platform

Cerebras

Sunnyvale, California, United States (On-site)

AI Infrastructure

Distributed Systems Engineering

4dNV

Senior Machine Learning Engineer, Quantized Inference

NVIDIA

Redmond, Washington, United States (On-site)$152k – $287.5k Yearly

AI Engineer

Deep Learning Engineer

2wNV

Senior Software Engineer – TensorRT Edge-LLM

NVIDIA

Santa Clara, California, United States (Hybrid)$152k – $287.5k Yearly

AI Engineering

Embedded Software

3wLA

Deployed Engineer (Central)

LangChain

Chicago, Illinois, United States or Remote (Illinois, United States + 1 more)$150k – $270k Yearly

Customer Engineering

Deployed Engineering

2wSE

ML Engineer

Sesame

New York, New York, United States (On-site)$190k – $320k Yearly

AI Engineer

LLM Engineering

2wPE

Full Stack Software Engineer - Applied AI

Perplexity

San Francisco, California, United States (On-site)$210k – $385k Yearly

AI Engineering

Full Stack Engineering

3wCR

Staff Software Engineer, Model LifeCycle

Crusoe

San Francisco, California, United States (On-site)$204k – $247k Yearly

AI Infrastructure

Cloud Engineering

2wNV

AI Safety Scientist, Deep Learning

NVIDIA

Ho Chi Minh City, Ho Chi Minh City, Vietnam (On-site)

AI Research

AI Safety

2wBA

Software Engineer - Model Performance

Baseten

San Francisco, California, United States (On-site)$150k – $250k Yearly

Backend Engineer

Engineering

7dCE

Senior Research Engineer - Inference ML

Cerebras

Sunnyvale, California, United States (Hybrid)

AI Research Engineer

Deep Learning

2wLA

FullStack Engineer, Observability & Evals Platform (LangSmith)

LangChain

San Francisco, California, United States (On-site)$145k – $180k Yearly

Backend Engineering

Frontend Engineering

1wCO

Forward Deployed Engineer

CoreWeave

Livingston, New Jersey, United States (Hybrid)$188k – $275k Yearly

AI Engineering

Customer Engineering

7dTM

Research Engineer, Infrastructure, Inference

Thinking Machines Lab

San Francisco, California, United States (On-site)$350k – $475k Yearly

AI Infrastructure

Infrastructure Engineering

2wPE

AI Inference Engineer (San Francisco)

Perplexity

San Francisco, California, United States (On-site)$210k – $385k Yearly

AI Engineering

7dCE

Applied AI/ML Scientist

Cerebras

United Arab Emirates (On-site)

AI Research Scientist

Applied Machine Learning

2wRA

Forward Deployed Engineer Lead

Reflection AI

New York, New York, United States (On-site)

Applied AI

Forward Deployed Engineering

4wSC

Senior Software Engineer, Connectivity

Scale

San Francisco, California, United States (On-site)$216.2k – $270.3k Yearly

Backend Engineer

Platform Engineer

1wCO

Senior Manager Forward Deployed Engineers

CoreWeave

Livingston, New Jersey, United States (Hybrid)$188k – $275k Yearly

AI Engineering

Engineering Management

7dCE

Principal ML Investigator

Cerebras

Sunnyvale, California, United States (On-site)

AI Research

Applied Science

7dCL

Staff Software Engineer, Machine Learning Infrastructure

Clarifai

United States + 4 more (Remote)

AI/ML

Infrastructure Engineering

Inference Jobs

Engineering Manager, Inference Platform

Senior Machine Learning Engineer, Quantized Inference

Senior Software Engineer – TensorRT Edge-LLM

Deployed Engineer (Central)

ML Engineer

Full Stack Software Engineer - Applied AI

Staff Software Engineer, Model LifeCycle

AI Safety Scientist, Deep Learning

Software Engineer - Model Performance

Senior Research Engineer - Inference ML

FullStack Engineer, Observability & Evals Platform (LangSmith)

Forward Deployed Engineer

Research Engineer, Infrastructure, Inference

AI Inference Engineer (San Francisco)

Applied AI/ML Scientist

Forward Deployed Engineer Lead

Senior Software Engineer, Connectivity

Senior Manager Forward Deployed Engineers

Principal ML Investigator

Staff Software Engineer, Machine Learning Infrastructure

Related searches