Home
Jobs
Model Serving

Model Serving Jobs

Browse 921 Model Serving jobs on Inference Jobs.

121-140 of 921 jobs

4dNV

Senior Machine Learning Engineer, Quantized Inference

NVIDIA

Redmond, Washington, United States (On-site)$152k – $287.5k Yearly

AI Engineer

Deep Learning Engineer

4dCO

Senior Software Engineer I, Inference

CoreWeave

Sunnyvale, California, United States (Hybrid)$139k – $204k Yearly

AI/ML Engineering

Backend Engineer

7dNE

Senior ML Engineer (AI Research)

Nebius

Europe + 4 more (Remote)

AI Engineer

AI Research

7dOP

Inference Runtime, Engineering Manager

OpenAI

San Francisco, California, United States (On-site)$455k – $555k Yearly

AI Engineering

Distributed Systems

2wNV

Senior AI Application Developer - GPU and SOC Architecture Modeling

NVIDIA

Santa Clara, California, United States (On-site)$152k – $287.5k Yearly

AI Application Development

Computer Architecture

7dNE

ML Engineer, Large Language Models (LLM Training & Inference Optimization)

Nebius

Europe (Remote)

AI Engineer

Deep Learning

7dCO

Senior Software Engineer II, Inference

CoreWeave

Sunnyvale, California, United States (Hybrid)$165k – $242k Yearly

AI/ML Engineering

Backend Engineering

2wD-

Senior Staff Machine Learning Engineer -Frameworks

d-Matrix

Santa Clara, California, United States (Hybrid)$155k – $250k Yearly

AI Engineer

Machine Learning Engineer

2wOP

Training: ML Framework Engineer

OpenAI

San Francisco, California, United States (Hybrid)$245k – $385k Yearly

Distributed Systems

Machine Learning Engineer

2wCA

Senior Applied Researcher, Audio Understanding

Cartesia

San Francisco, California, United States (On-site)$200k – $350k Yearly

AI Research

Applied Research

2wPE

Software Engineer - Data Flywheel

Perplexity

London, England, United Kingdom (On-site)$210k – $385k Yearly

Analytics Engineer

Backend Engineer

2wNV

Senior AI Software Engineer, GenAI Framework

NVIDIA

Santa Clara, California, United States (On-site)$152k – $287.5k Yearly

AI Engineering

AI Research

7dCE

Applied AI/ML Scientist

Cerebras

United Arab Emirates (On-site)

AI Research Scientist

Applied Machine Learning

2wCE

Performance Engineer - Inference

Cerebras

Toronto, Ontario, Canada (On-site)

AI Infrastructure

High Performance Computing (HPC)

7dMA

AI Scientist - Paris/London

Mistral AI

Île de Ré, Charente-Maritime, France (Hybrid)

AI Research

Artificial Intelligence

2wCE

Senior Full Stack LLM Engineer - Training

Cerebras

Sunnyvale, California, United States (On-site)

AI Research

Compiler Engineering

7dSC

Applied AI Engineering Manager, Enterprise

Scale

San Francisco, California, United States (On-site)$248.4k – $310.5k Yearly

AI Engineering

Applied AI

7dAN

Research Engineer, Pretraining Scaling

Anthropic

San Francisco, California, United States (On-site)$315k – $560k Yearly

AI Research

AI Research & Engineering

2wD-

ML Compiler Architect, Senior Principal

d-Matrix

Toronto, Ontario, Canada (Hybrid)

Compiler Engineering

Machine Learning Compiler

2wBA

Engineering Manager - Forward Deployed Engineering (LLM)

Baseten

San Francisco, California, United States (On-site)$220k – $285k Yearly

AI Engineering

Engineering Management

Inference Jobs

Senior Machine Learning Engineer, Quantized Inference

Senior Software Engineer I, Inference

Senior ML Engineer (AI Research)

Inference Runtime, Engineering Manager

Senior AI Application Developer - GPU and SOC Architecture Modeling

ML Engineer, Large Language Models (LLM Training & Inference Optimization)

Senior Software Engineer II, Inference

Senior Staff Machine Learning Engineer -Frameworks

Training: ML Framework Engineer

Senior Applied Researcher, Audio Understanding

Software Engineer - Data Flywheel

Senior AI Software Engineer, GenAI Framework

Applied AI/ML Scientist

Performance Engineer - Inference

AI Scientist - Paris/London

Senior Full Stack LLM Engineer - Training

Applied AI Engineering Manager, Enterprise

Research Engineer, Pretraining Scaling

ML Compiler Architect, Senior Principal

Engineering Manager - Forward Deployed Engineering (LLM)

Related searches