1. Home
  2. Jobs
  3. Japan
  4. Tokyo Prefecture
  5. Technical Support
  6. Support Engineer - AI Server Systems
Tenstorrent logoTE
Tenstorrenttenstorrent.com

Support Engineer - AI Server Systems

Tokyo Prefecture, JapanFull-time1h ago

Tenstorrent is leading the industry on cutting-edge AI technology, revolutionizing performance expectations, ease of use, and cost efficiency. With AI redefining the computing paradigm, solutions must evolve to unify innovations in software models, compilers, platforms, networking, and semiconductors. Our diverse team of technologists have developed a high performance RISC-V CPU from scratch, and share a passion for AI and a deep desire to build the best AI platform possible. We value collaboration, curiosity, and a commitment to solving hard problems. We are growing our team and looking for contributors of all seniorities.

勤務地:東京

Tenstorrentでは、AIサーバーおよび関連インフラの安定運用を支える Support Engineer. AI Infrastrcuture を募集しています。
本ポジションでは、GPUクラスタ、ストレージ、ネットワーク機器を含むシステムの保守・障害対応・予防保守を担当し、社内外の関係者と連携しながら、高可用性なAIインフラ環境の維持に貢献していただきます。

Who You Are

  • ハードウェア保守・障害対応に強みを持ち、現場での迅速な切り分けと対応ができる方

  • 顧客現場やデータセンター環境でのサポート業務を主体的に進められる方

  • Linuxサーバー、GPUサーバー、ネットワーク機器に関する基本的な知識と実務経験をお持ちの方

  • インシデント発生時にも冷静に状況を整理し、適切にエスカレーションできる方

  • 国内外の関係者と協力しながら、正確で丁寧なコミュニケーションができる方

  • 実務を通してAIインフラや高性能コンピューティング環境への理解を深めたい方

What We Need

  • AIサーバーおよび関連システム(GPUクラスタ、ストレージ、ネットワーク機器等)の保守・点検・障害対応

  • サーバー障害時の一次切り分け、オンサイト修理、部品交換

  • NOC(Network Operations Center)やリモート監視ツールを用いた稼働状況の監視およびログ分析

  • トラブル発生時のインシデントレポート作成と関係者への報告

  • ファームウェア、BIOS、ドライバの更新対応

  • 顧客向け定期点検および予防保守の計画・実施

  • エンジニアリング部門およびサポート部門と連携したエスカレーション対応

  • 保守用在庫の管理、交換部品の配送調整

  • 現場導入支援、設置・移設作業への立ち会いおよび主導

  • 日本語および英語能力

Required Qualifications

  • x86サーバー、特にGPUサーバーの保守経験

  • ハードウェア障害の切り分けスキル(電源、メモリ、ストレージ、PCIe、GPU等)

  • Linux環境(Ubuntu、RHEL、CentOS等)での操作経験

  • 基本的なネットワーク知識(L2/L3、TCP/IP、DHCP、IPMI)

  • 顧客現場での技術サポート経験、またはオンサイト対応経験

  • 障害対応や保守作業に関するドキュメント作成スキル

  • IPMItool、smartctl、nvidia-smi等の診断ツール使用経験

  • 英語マニュアルの読解力、および海外サポート窓口とのやり取り経験

  • 普通自動車運転免許

Nice to Have

  • NVIDIA GPUサーバー(DGX、HGX等)やSupermicro、Inspur、Lambda等のハードウェア取り扱い経験

  • Ethernet、InfiniBand、NVLink、PCIeスイッチに関する知識

  • データセンターでの運用・保守経験

  • GPUベースのディープラーニングやAIワークロードに関する基礎知識

  • Linux shellスクリプトによる簡易自動化経験

What You Will Learn

  • 最先端のAIサーバーおよび高性能コンピューティング環境の運用知識

  • GPUクラスタ、ストレージ、ネットワークを含む大規模インフラの保守・トラブルシューティング実務

  • 社内エンジニアリングチームおよびグローバルサポートチームと連携した問題解決プロセス

  • AIワークロードを支えるハードウェア・システム全体の構造と運用の考え方

  • 急成長するAI・半導体業界における実践的なインフラサポートスキル

本雇用契約の提示は、応募者が米国の輸出管理対象技術へアクセス可能な資格を有することを条件とする場合があります。米国輸出関連法規に基づき、特定の情報、システム、または技術へのアクセスには、市民権、永住権の状況、または必要なライセンス取得可否の確認が必要となる場合があります。

This offer of employment is contingent upon the applicant being eligible to access U.S. export-controlled technology.  Due to U.S. export laws, including those codified in the U.S. Export Administration Regulations (EAR), the Company is required to ensure compliance with these laws when transferring technology to nationals of certain countries (such as EAR Country Groups D:1, E1, and E2).   These requirements apply to persons located in the U.S. and all countries outside the U.S.  As the position offered will have direct and/or indirect access to information, systems, or technologies subject to these laws, the offer may be contingent upon your citizenship/permanent residency status or ability to obtain prior license approval from the U.S. Commerce Department or applicable federal agency.  If employment is not possible due to U.S. export laws, any offer of employment will be rescinded.