Home
Jobs
Adversarial Training

Adversarial Training Jobs

Browse 19 Adversarial Training jobs on Inference Jobs.

19 jobs

3w ago

Researcher, Robustness & Safety Training

OpenAI

San Francisco, California, United States (On-site)$295K – $445K Yearly

AI Safety Research

Machine Learning Research

RLHF

Adversarial Training

4w ago

Technical Program Manager – Adversarial Model Research

OpenAI

San Francisco, California, US$230K – $285K Yearly

Technical Program Management

AI Safety

Technical Program Management

AI Safety

3w ago

Researcher, Misalignment Research

OpenAI

San Francisco, California, United States (On-site)$295K – $445K Yearly

AI Safety Research

Red Teaming

AI Safety

15h ago

Research Scientist, Agent Robustness

Scale

San Francisco, California, United States (On-site)$216K – $270K Yearly

4w ago

Research Scientist, Safety Post Training

Scale

San Francisco, California, United States (On-site)$216K – $270K Yearly

Research Scientist

AI Safety Research

Post-Training Methods

RLHF

2w ago

Machine Learning Engineer, Safeguards

Anthropic

San Francisco, California, United States (Hybrid)$350K – $500K Yearly

Machine Learning Engineer

AI Safety

Python

Machine Learning

15h ago

Researcher, Automated Red Teaming

OpenAI

San Francisco, California, United States (On-site)$295K – $445K Yearly

AI Safety

Red Teaming

Automated Red Teaming

LLMs

3w ago

Researcher, Alignment Training

OpenAI

San Francisco, California, United States (On-site)$250K – $445K Yearly

Machine Learning Research

AI Alignment Research

Large-Scale Model Training

Large-Scale ML

2w ago

Agent Post-Training, Frontier Evals and Environments Research

OpenAI

San Francisco, California, United States (On-site)$295K – $445K Yearly

3w ago

Research Scientist, Frontier Risk Evaluations

Scale

San Francisco, California, United States (On-site)$216K – $270K Yearly

4w ago

Research Engineer, Safeguards Labs

Anthropic

San Francisco, California, United States (Hybrid)$350K – $850K Yearly

AI Research & Engineering

Trust and Safety

Python

Large Language Models

1w ago

Strategic Projects Lead, Red Team

Scale

San Francisco, California, United States (On-site)$121.6K – $190K Yearly

AI Safety

Strategic Partnerships

AI Safety

Red Teaming

3w ago

Research Scientist, Gemini Safety

DeepMind

Mountain View, California, United States (On-site)

GenAI

Research Scientist

Large Language Models

Post-training

2w ago

Agent Post-Training, Artifacts Research

OpenAI

San Francisco, California, United States (On-site)$295K – $445K Yearly

Research

Agents

LLM

Reinforcement Learning

3w ago

Member of Technical Staff - Safety Lead

Reflection AI

San Francisco, California, United States (On-site)

AI Safety

Machine Learning Engineer

AI Safety

Red Teaming

3w ago

Researcher, Safety & Privacy

OpenAI

San Francisco, California, United States (On-site)$295K – $445K Yearly

Safety Systems

AI Safety

Privacy-Preserving Computation

Secure Enclaves

4w ago

Threat Modeler Lead

OpenAI

San Francisco, California, United States (On-site)$325K – $325K Yearly

3w ago

Technical Lead, Safety Research

OpenAI

San Francisco, California, United States (Hybrid)$460K – $555K Yearly

3w ago

Researcher, Trustworthy AI

OpenAI

San Francisco, California, United States (On-site)$380K – $380K Yearly

AI Safety Research

Machine Learning Research

Python

AI Safety

Inference Jobs

Discover the latest AI roles from Inference Jobs.

Powered byCavuno

For Candidates

Jobs
Companies
Pricing

For Companies

Post a job
Pricing

Resources

Locations
Salaries
Sitemap

About

About