Home
Jobs
XLA/MLIR

XLA/MLIR Jobs

Browse 80 XLA/MLIR jobs on Inference Jobs.

61-80 of 80 jobs

2wOP

Research-Hardware Codesign Engineer

OpenAI

San Francisco, California, United States (Hybrid)$230k – $460k Yearly

Hardware Engineering

Machine Learning Research

2wPE

AI Inference Engineer (San Francisco)

Perplexity

San Francisco, California, United States (On-site)$210k – $385k Yearly

AI Engineering

1wAN

TPU Kernel Engineer

Anthropic

San Francisco, California, United States (Hybrid)$280k – $560k Yearly

AI Infrastructure

Kernel Engineering

2wMO

Member of Technical Staff - ML Performance

Modal

New York, New York, United States (On-site)$150k – $270k Yearly

AI Infrastructure

Engineering

20hGR

2026 Software Engineering Intern - ML Kernels & Runtime Team

Graphcore

Bristol, England, United Kingdom (On-site)

C++ Development

Internships

3dNV

Senior Systems Software Engineer - Deep Learning Solutions

NVIDIA

Toronto, Ontario, Canada (On-site)C$225k – C$275k Yearly

AI/ML Engineering

Autonomous Driving

3wD-

Senior Staff Machine Learning Engineer -Frameworks

d-Matrix

Santa Clara, California, United States (Hybrid)$155k – $250k Yearly

AI Engineer

Machine Learning Engineer

1wTA

Research Engineer, Core ML

Together AI

San Francisco, California, United States (On-site)$200k – $280k Yearly

AI Research

Deep Learning

1wTE

Software Engineer

Tenstorrent

東京都, Tokyo Prefecture, Japan (On-site)

Deep Learning

HPC

2wHA

LLM Inference Engineer

Hippocratic AI

Palo Alto, California, United States (On-site)

AI Infrastructure

Inference Optimization

2wPL

LLM Inference Engineer

Periodic Labs

Menlo Park, California, United States (On-site)

AI Research & Engineering

Deep Learning

2wNV

Senior Deep Learning Engineer

NVIDIA

Warszawa, Masovian Voivodeship, Poland (Hybrid)zł 292.5k – zł 507k Yearly

AI Engineer

Deep Learning Engineer

2wD-

Machine Learning Research Intern

d-Matrix

Santa Clara, California, United States (Hybrid)$30 – $59 Hourly

AI Researcher

Internship

2wNV

Senior Software Engineer – TensorRT Edge-LLM

NVIDIA

Santa Clara, California, United States (Hybrid)$152k – $287.5k Yearly

AI Engineering

Embedded Software

6dCE

Kernel Engineer

Cerebras

Sunnyvale, California, United States (On-site)

AI Engineering

High-Performance Computing

3wNV

Senior Software Engineer, AI Inference Systems

NVIDIA

Santa Clara, California, United States (Hybrid)$184k – $356.5k Yearly

AI Inference

Backend Development

1wTA

Machine Learning Engineer - Inference

Together AI

San Francisco, California, United States (On-site)$160k – $230k Yearly

AI Research

Inference Engineer

1wNV

Raytracing Compiler Engineer - Developer and Performance Technology

NVIDIA

Santa Clara, California, United States (On-site)$184k – $356.5k Yearly

Compiler Engineering

Developer Tools

4wD-

Machine Learning Intern - Dynamic KV-Cache Modeling for Efficient LLM Inference

d-Matrix

Campbell, California, United States or Remote (California, United States)$30 – $59 Hourly

AI Research

Data Science

3wNV

Senior Deep Learning Performance Architect

NVIDIA

California, United States (Hybrid)$152k – $287.5k Yearly

Deep Learning

GPU Architecture

Inference Jobs

Research-Hardware Codesign Engineer

AI Inference Engineer (San Francisco)

TPU Kernel Engineer

Member of Technical Staff - ML Performance

2026 Software Engineering Intern - ML Kernels & Runtime Team

Senior Systems Software Engineer - Deep Learning Solutions

Senior Staff Machine Learning Engineer -Frameworks

Research Engineer, Core ML

Software Engineer

LLM Inference Engineer

LLM Inference Engineer

Senior Deep Learning Engineer

Machine Learning Research Intern

Senior Software Engineer – TensorRT Edge-LLM

Kernel Engineer

Senior Software Engineer, AI Inference Systems

Machine Learning Engineer - Inference

Raytracing Compiler Engineer - Developer and Performance Technology

Machine Learning Intern - Dynamic KV-Cache Modeling for Efficient LLM Inference

Senior Deep Learning Performance Architect

Related searches