DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,是一家成立于2023年的创新型科技公司,由知名私募巨头幻方量化孕育而生,专注于开发先进的大语言模型(LLM)和相关技术。凭借强大的深度学习能力和广泛的应用场景,DeepSeek在全球科技领域引发广泛关注。
随着国产开源大模型DeepSeek的强势出圈,其背后的核心团队也引起了广泛专注。资料显示,DeepSeek的创始人为梁文锋,公司核心团队的最大特点是年轻,核心技术岗位基本上以应届和毕业一两年的人为主,许多成员的工作时间都不长,不少还是在读博士。除此之外,DeepSeek团队成员也多来自中国本土市场,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,鲜有“海归”。
*DeepSeek主创团队名单是小编根据公开资料整理而得。名单仅供参考和帮助,欢迎在末尾交流探讨。
梁文锋,毕业于浙江大学,拥有信息与电子工程学系学士和硕士学位,杭州幻方科技有限公司、DeepSeek创始人。在他的带领下,DeepSeek对人才极其看重,不看经验,只看能力。
高华佐,毕业于北京大学物理系,为MLA架构做出了关键创新。
曾旺丁,毕业于北京邮电大学,研究生导师是北邮人工智能与网络搜索教研中心主任张洪刚,其为MLA架构做出了关键创新。
邵智宏,清华大学交互式人工智能(CoAI)课题组博士生,师从黄民烈教授。曾在微软研究院工作过,是DeepSeekMath核心作者之一,此外还参与了DeepSeek-Prover、DeepSeek-Coder-v2、DeepSeek-R1等项目。
朱琪豪,北京大学计算机学院软件研究所2024届博士毕业生,受熊英飞副教授和张路教授指导,研究方向为深度代码学习。朱琪豪是DeepSeekMath核心作者之一,此外还基于他的博士论文工作,主导开发了DeepSeek-Coder-V1。
Peiyi Wang,北京大学博士生,受北京大学计算语言学教育部重点实验室穗志方教授指导,是DeepSeekMath核心作者之一。
代达劢,2024年博士毕业于北京大学计算机学院计算语言所,师从穗志方教授,他从V1就加入到DeepSeek,一直到V3。
赵成钢,毕业于清华大学,大二时成为清华学生超算团队正式成员,三次获得世界大学生超算竞赛冠军,曾在英伟达实习,在DeepSeek中担任训练/推理基础架构工程师。
吴俣,2019年博士毕业于北京航空航天大学,博士期间接受北航李舟军教授和MSRA前副院长周明博士的联合培养,曾在微软MSRA参与过小冰和必应百科项目,是DeepSeek后训练团队的负责人。
郭达雅,2023年博士毕业于中山大学,由中山大学印鉴教授与MSRA周明博士联合培养,2024年7月加入DeepSeek,主要参与了一系列数学和代码大模型的工作。