DeepSeek 模型发布和重大事件时间线一览
这里整理一下 DeepSeek 重大里程碑事件,部分内容参考 DeepSeek 在 HuggingFace 的官方空间。为了方便预览和美观,我做了一个网页版,大家可自行取用。 2023年7月:DeepSeek 公司成立 核心功能:致力于 AGI 功能介绍:由知名量化资管巨头幻方量化创立,其掌门人梁文锋是 DeepSeek 的创始人。 2023年11月:开源 DeepSeekLLM 7B 和 67B 的 Base 和 Chat 模型 核心功能:DeepSeek LLM 67B Base 在推理、代码、数学和中文理解等多个领域超越了 Llama2 70B Base。 功能介绍:DeepSeek Coder 是一系列从零在包含 87% 代码和 13% 自然语言的 2T tokens 数据集上从头开始训练的代码语言模型,它旨在提升代码编写的效率和质量,MIT 许可并允许商业用途。 2024年2月:开源 DeepSeek Coder 系列模型 核心功能:DeepSeek Coder 提供 1B、5.7B、6.7B 和 33B 等多种模型尺寸,用户可以根据自身需求和硬件条件选择合适的模型。 功能介绍:在 HumanEval, MultiPL-E, MBPP, DS-1000 和 APPS 基准测试中,性能在公开可用的代码模型中处于领先地位,MIT 许可并允许商业用途。 2024年2月:开源 DeepSeek Math 模型 核心功能:DeepSeekMath 7B 模型在 MATH 基准测试中取得了令人印象深刻的 51....