職位描述
崗位職責(zé):1. 負(fù)責(zé)大模型流程加速工具的研發(fā),包括但不限于大模型壓縮、自動混合精度推理、異步并行推理等功能模塊;2. 負(fù)責(zé)大模型的訓(xùn)練、調(diào)優(yōu)和部署,確保模型性能保持較佳狀態(tài);3. 深入研究和探索大模型的新技術(shù)和新方法,提高模型的效果和效率;4. 協(xié)助團(tuán)隊其他成員理解和應(yīng)用大模型技術(shù),提供技術(shù)支持和培訓(xùn);5. 持續(xù)關(guān)注和研究大模型領(lǐng)域的最新技術(shù)和進(jìn)展,推動團(tuán)隊的技術(shù)創(chuàng)新。6. 深入理解大模型推理的原理和算法,持續(xù)優(yōu)化工具的性能和效率;7. 配合團(tuán)隊成員進(jìn)行工具的測試、部署和集成;8. 編寫相關(guān)技術(shù)文檔,提供技術(shù)支持和培訓(xùn)。任職要求:1. 碩士及以上學(xué)歷,計算機(jī)科學(xué)、人工智能或相關(guān)領(lǐng)域?qū)I(yè);2. 三年以上大模型訓(xùn)練工作經(jīng)驗 或 三年以上大模型流程加速工具開發(fā)經(jīng)驗;3. 熟練掌握至少一種編程語言(如Python、C++等),具備良好的代碼風(fēng)格和編程習(xí)慣;4. 對大模型推理技術(shù)有深入了解,具備相關(guān)算法和數(shù)據(jù)結(jié)構(gòu)的知識;5. 對大模型訓(xùn)練的原理、算法和技巧有深入了解,具備相關(guān)知識和實踐經(jīng)驗;6. 具備良好的團(tuán)隊協(xié)作和溝通能力,能夠與不同背景的團(tuán)隊成員有效協(xié)作;7. 對新技術(shù)充滿熱情,具備快速學(xué)習(xí)能力和創(chuàng)新思維。
企業(yè)介紹
思騰合力(天津)科技有限公司定位于視覺計算推動者,專注于人工智能領(lǐng)域,提供深度學(xué)習(xí)、GPU高性能計算、虛擬化、分布式存儲、集群管理等產(chǎn)品和整體解決方案,助力和推動各企事業(yè)單位不斷發(fā)展需求。思騰合力(天津)科技有限公司現(xiàn)成立于天津經(jīng)濟(jì)技術(shù)開發(fā)區(qū)逸仙園科技園,前身為成立于2009年的北京思騰合力科技有限公司,公司自成立之時就致力于發(fā)展高性能計算方向,從簡單的CPU計算開始到現(xiàn)在的單機(jī)多GPU運(yùn)算,再到高浮點運(yùn)算能力的GPU集群方案,經(jīng)歷了硬件變更和應(yīng)用技術(shù)的更新迭代,公司逐步壯大了銷售板塊和經(jīng)營的業(yè)務(wù)模塊,同時在GPU人工智能與高性能計算領(lǐng)域積累多年的技術(shù)經(jīng)驗,更是在2017年營業(yè)額突破億元大關(guān),合作客戶包括清華大學(xué),北京大學(xué),北京理工大學(xué),中科院計算所,中科院自動化所,中科院力學(xué)所,中科院遙感所,中科院信息工程所,以及國內(nèi)知名人工智能公司等各企事業(yè)單位思騰合力目前分為思騰合力(天津)科技有限公司(以下簡稱為:天津公司)和北京思騰合力科技有限公司(北京公司),天津公司作為制造和生產(chǎn)基地,負(fù)責(zé)公司產(chǎn)品在產(chǎn),質(zhì)檢,物流等功能,北京公司以銷售和售后為主公司主營深思系列“DeepThink”系列GPU服務(wù)器,型號包括有 IW4200-2G/4G/8G/10G等多種型號產(chǎn)品,單臺機(jī)器可支持2-10顆GPU運(yùn)算卡,充分滿足不同客戶對算力的需求。人工智能領(lǐng)域的不斷發(fā)展也要求公司技術(shù)層面的不斷提升,思騰合力在提高產(chǎn)品品質(zhì)同時也配合客戶需求對所經(jīng)營深思系列GPU Server產(chǎn)品預(yù)裝CUDA、CUDNN及caffe、Tensorflow等主流深度學(xué)習(xí)框架,同時能夠提供GPU調(diào)優(yōu),集群搭建等整體解決方案