職位描述

職責描述:
-建設業界出眾的ai異構算力容器平臺,提供高性能、高穩定性、高易用性的百舸產品,支持智駕、aigc、金融能源、智算中心客戶ai應用高效部署
-負責云原生ai容器相關產品的架構設計和產品研發,引入開源社區先進的ai框架、ai調度、ai工作流和ai可觀測能力組件構建全棧ai應用云原生解決方案
-構建異構多元芯算力底座,支持國產化信創,支持gpu虛擬化和混部調度,提升ai應用資源效率
-無縫對接客戶和云上ai開發平臺,支持文心和開源大模型訓練推理任務部署,提供訓練容錯和彈性伸縮能力
-對接客戶基礎設施環境構建異構算力平臺解決方案,支持大模型訓練/推理tob交付
-探索業界最新技術方向,參與開源社區,提升百度云原生ai核心競爭力
任職要求:
-本科及以上學歷,有一定程度的計算機相關專業知識背景
-優秀的編碼能力,熟悉golang/python/java/c/c++至少一項,有扎實的算法及數據結構基礎,有良好的編程習慣
-精通kubernetes基本工作原理,了解調度器、device-plugin、容器運行時運行機制、容器網絡、rdma通信;有kubeflow、volcano等相關開發經驗優先
-熟悉開源大模型glm/llama/gpt3優先,熟悉tensorflow/caffe/pytorch框架者優先,有大規模訓練實踐經驗者優先
-對異構芯片虛擬化、cuda編程、rdma有一定了解者優先
-優秀的團隊協作能力;具備較強的ownership,以結果為導向,負責領域內善于思考并積極改進
工作地點
地址:錦州
