Image/Video/Audio-to-Text Modalities Jobs

Machine Learning

Deep Learning

2d ago

Research Engineer, Multimodal Generative AI (Image/Video)

DeepMind

Kirkland, Washington, United States (On-site)$166K – $244K Yearly

Generative AI

Video and image annotation

Multimodal Generative AI

Image Generation

2w ago

AI Trainer - Advanced Video and Image Annotation (US & Canada)

Prolific

United States + 1 more (Remote)Up to $25 Hourly

AI Training

AI Data Annotation

Video Annotation

5d ago

Engineering Manager, Multimodal (API)

OpenAI

San Francisco, California, United States (On-site)$293K – $385K Yearly

Applied AI Engineering

Engineering Management

Multimodal AI

Real-time APIs

2w ago

Member of Technical Staff - Imagine Model

xAI

Palo Alto, California, United States (On-site)$180K – $440K Yearly

Multimodal Machine Learning

AI Researcher

6d ago

Research Engineer, Human Understanding

Google DeepMind

Los Angeles, California, United States (On-site)$174K – $252K Yearly

Frontier AI

Research Engineering

Multi-modal Modelling

Multimodal Models

5d ago

Senior Member of Technical Staff, Multimodal AI

Cohere

San Francisco, California, US or Remote (Worldwide)

AI Research Engineer

JAX

4w ago

Medicine Specialist - Human Data

xAI

Worldwide (Remote)$45 – $100 Hourly

Human Data

Data Annotation

Medical Imaging

Clinical Decision-Making

2w ago

Research, Audio Expertise

Thinking Machines Lab

San Francisco, California, United States (On-site)$350K – $475K Yearly

AI Research

Senior Deep Learning Researcher

2w ago

AI Tutor - Image Specialist

xAI

Worldwide (Remote)

19h ago

Senior Deep Learning Researcher, Diffusion

NVIDIA

Tel Aviv-Yafo, Tel Aviv District, Israel (On-site)

AI Research Scientist

Deep Learning

Diffusion Models

2w ago

Research Engineer, Audio

Anthropic

San Francisco, California, United States (Hybrid)$350K – $500K Yearly

AI Research & Engineering

Audio Engineering

JAX

Machine Learning Engineering

2w ago

Member of Technical Staff - Multimodal Understanding

xAI

Palo Alto, California, United States (On-site)$180K – $440K Yearly

Multimodal AI

3d ago

Research Scientist - Audio Codec

Mirelo AI

Berlin, Berlin, Germany (Hybrid)

Research

Deep Learning

Neural Audio Codecs

6d ago

Research Scientist, Gemini Safety

Google DeepMind

Mountain View, California, United States (On-site)

GenAI

Research Scientist

Large Language Models

Post-Training

2d ago

Senior Applied Researcher, Audio Understanding

Cartesia

San Francisco, California, United States (On-site)$200K – $350K Yearly

Applied Research

State Space Models

SSM

5d ago

Audio Inference Engineer, Model Efficiency

Cohere

New York, US or Remote (Canada + 4 more)

AI Infrastructure

C++

2w ago

Helix AI Engineer, Video Pretraining

Figure

San Jose, California, United States (On-site)

AI Engineer

2w ago

Research, Vision Expertise

Thinking Machines Lab

San Francisco, California, United States (On-site)$350K – $475K Yearly

AI Research

Computer Vision Research