TensorRT-LLM Jobs

vLLM

3mo agoNE

Senior ML Engineer (Token Factory)

Nebius

Amsterdam, North Holland, NL

Machine Learning Compiler

AI Infrastructure

C++

GPU Programming

3mo agoD-

ML Compiler Architect, Senior Principal

d-Matrix

Toronto, Ontario, Canada (Hybrid)

Compiler Engineering

MLIR

LLVM

3mo agoNE

System Engineer (Token Factory)

Nebius

Netherlands + 5 more (Remote)

2mo agoNV

Senior Systems Software Engineer - Deep Learning Solutions

NVIDIA

Toronto, Ontario, Canada (On-site)C$225K – C$275K Yearly

Systems Software Engineering

Deep Learning

Deep Learning Inference

CUDA

3mo agoPE

AI Inference Engineer (San Francisco)

Perplexity

San Francisco, California, United States (On-site)$210K – $385K Yearly

AI Engineering

Rust

3w agoTE

Staff Engineer, ML Models

Tenstorrent

Cyprus (Hybrid)

Staff Engineer

TensorFlow

3mo agoCE

Python / PyTorch Developer — Frontend Inference Compiler – Dubai

Cerebras

United Arab Emirates (On-site)

Compiler Engineer

Autonomy Software Engineering

2w agoNV

Senior Software Architect, AI Networking

NVIDIA

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)

Software Architecture

AI/ML Engineering

Distributed Systems

C++

2mo agoAI

ML Runtime Optimization Engineer - Lead

Applied Intuition

Sunnyvale, California, US$199.3K – $264.5K Yearly

Machine Learning Engineering

Machine Learning

Machine Learning Engineering

4w agoAI

ML Runtime Optimization Engineer

Applied Intuition

Sunnyvale, California, United States (On-site)$159.1K – $199.3K Yearly

Embedded Software Engineering

JAX

1d agoNV

Applied AI Engineer - Silicon Co-Design Group

NVIDIA

Shanghai, Shanghai, China (On-site)

AI/LLM Engineering

Applied AI Engineering

Machine Learning Research

2mo agoTA

Research Engineer, Core ML

Together AI

San Francisco, California, United States (On-site)$200K – $280K Yearly

Machine Learning Infrastructure

RL Algorithms

Inference Optimization

3w agoTM

Research Engineer, Infrastructure, Kernels

Thinking Machines Lab

San Francisco, California, United States (On-site)$350K – $475K Yearly

AI Research Engineer

CUDA

CuTe

1mo agoNV

Inference Optimization Architect, Speech AI

NVIDIA

Pune, Maharashtra, India (On-site)

AI Infrastructure

Deep Learning Engineering

Inference Optimization

Speech AI

2mo agoNV

Senior Research Scientist, Fundamental LLM Research for Knowledge, Reasoning, and Agents

NVIDIA

Santa Clara, California, United States (On-site)$224K – $356.5K Yearly

Machine Learning Research

AI Research

Large Language Models (LLMs)

Natural Language Processing (NLP)

3mo agoSE

ML Model Serving Engineer

Sesame

San Francisco, California, United States (On-site)$175K – $280K Yearly

Machine Learning Infrastructure

AI Engineer

LLM Serving

VLLM

3mo agoPL

Distributed Training Engineer

Periodic Labs

Menlo Park, California, United States (Hybrid)

LLM Training

Distributed Systems

4w agoCE

LLM Inference Performance & Evals Engineer

Cerebras

Toronto, Ontario, Canada (On-site)

LLM Engineering