由于我日常开发中经常用到 OpenAI 的接口,这里列一下 OpenAI 各个模型的简单介绍以及各模型 api 的收费标准、上下文窗口、最大输出token、训练数据截止日期等信息。
模型概述
模型 | 描述 |
---|---|
GPT-4o | 最快且最实惠的旗舰型号 |
GPT-4o mini | 我们的经济实惠且智能的小型模型,适用于快速、轻量级任务。 |
o1-preview 和 o1-mini | 通过强化学习训练的语言模型可以执行复杂的推理。 |
GPT-4 和 GPT-4 Turbo | 一组在 GPT-3.5 基础上改进的模型,能够理解和生成自然语言或代码 |
GPT-3.5 Turbo | 一组在 GPT-3.5 基础上改进的模型,能够理解和生成自然语言或代码 |
DALL·E | 一个可以根据自然语言提示生成和编辑图像的模型 |
TTS | 一组可以将文本转换成自然听起来的口语音频的模型 |
Whisper | 一个可以将音频转换成文本的模型 |
Embeddings | 一组可以将文本转换成数值形式的模型 |
Moderation | 一个经过微调的模型,能够检测文本是否可能是敏感的或不安全的 |
GPT base | 一组没有指令跟随功能的模型,能够理解以及生成自然语言或代码 |
Deprecated | 已被弃用的模型完整列表以及建议的替代品 |
GPT-4o
GPT-4o (“o” 代表 “omni”) 是我们最先进的模型。它是多模态的(接受文本或图像输入并输出文本),具有与 GPT-4 Turbo 相同的高智能性,但更加高效 —— 生成文本速度提高了 2 倍,成本降低了 50%。此外,GPT-4o 在所有非英语语言中具有最佳的视觉和性能。GPT-4o 可供付费客户在 OpenAI API 中使用。在我们的文本生成指南中学习如何使用 GPT-4o。
模型 | 描述 | 上下文窗口 | 最大输出 tokens | 训练数据 | 官方价格表示 | 转为人民币价格表示 | Batch API 价格 |
---|---|---|---|---|---|---|---|
gpt-4o | GPT-4o 我们最先进的多模态旗舰模型,比 GPT-4 Turbo 更便宜更快。目前指向 gpt-4o-2024-05-13。 | 128,000 tokens | 4,096 tokens | 截至 2023 年 10 月 | - | - | - |
gpt-4o-2024-05-13 | gpt-4o 目前指向该版本。 | 128,000 tokens | 4,096 tokens | 截至 2023 年 10 月 | 输入:$5.00 / 1M tokens 输出:$15.00 / 1M tokens 图片价格:150px by 150px = $0.001275;低分辨率为$0.000425 |
输入:¥0.035 / 1000 tokens 输出:¥0.105 / 1000 tokens 图片价格:150px by 150px = ¥0.009;低分辨率为¥0.003 |
输入:$2.50 / 1M tokens 输出:$7.50 / 1M output tokens |
gpt-4o-2024-08-06 | 最新的支持结构化输出的版本(在更新gpt-4o指向该版本之前提前3周发布公告) | 128,000 tokens | 16,384 tokens | 截至 2023 年 10 月 | 输入:$2.5 / 1M tokens 输出:$10.00 / 1M tokens 图片价格:150px by 150px = $0.000638;低分辨率为$0.000213 |
输入:¥0.0175 / 1000 tokens 输出:¥0.07 / 1000 tokens 图片价格:150px by 150px = ¥0.0045;低分辨率为¥0.0015 |
输入:$1.25 / 1M tokens 输出:$5.00 / 1M output tokens |
chatgpt-4o-latest | 动态模型已持续更新至当前版本的 GPT-4o,以用于 ChatGPT,主要用于研究和评估[2] | 128,000 tokens | 16,384 tokens | 截至 2023 年 10 月 | 输入:$5.00 / 1M tokens 输出:$15.00 / 1M tokens 图片价格:150px by 150px = $0.001275;低分辨率为$0.000425 |
输入:¥0.035 / 1000 tokens 输出:¥0.105 / 1000 tokens 图片价格:150px by 150px = ¥0.009;低分辨率为¥0.003 |
输入:$2.50 / 1M tokens 输出:$7.50 / 1M output tokens |
*Batch API 定价要求请求以批量形式提交。响应将在 24 小时内返回,可享受 50% 折扣。了解有关批量 API 的更多信息 ↗
*[2] 我们发布此模型,供开发者和研究人员探索 OpenAI 的最新研究成果。对于生产环境,OpenAI 建议使用针对 API 优化的稳定版本 GPT 模型。
GPT-4o mini
GPT-4o mini(“o”代表“omni”)是我们小型型号类别中最先进的型号,也是我们迄今为止最便宜的型号。它是多模态的(接受文本或图像输入并输出文本),具有比 gpt-3.5-turbo 更高的智能,但速度同样快。它旨在用于较小的任务,包括视觉任务。
我们建议您在之前使用 gpt-3.5-turbo 的地方选择 gpt-4o-mini ,此模型功能更强大且更便宜。
模型 | 描述 | 上下文窗口 | 最大输出 tokens | 训练数据 | 官方价格表示 | 转为人民币价格表示 | Batch API 价格 |
---|---|---|---|---|---|---|---|
gpt-4o-mini | 新 GPT-4o-mini:我们经济实惠且智能的小模型,用于快速、轻量级任务。GPT-4o-mini 比 GPT-3.5 Turbo 更便宜且更强大。目前指向 gpt-4o-mini-2024-07-18。 | 128,000 tokens | 16,384 tokens | 截至 2023 年 10 月 | - | - | - |
gpt-4o-mini-2024-07-18 | gpt-4o-mini 目前指向此版本。 | 128,000 tokens | 16,384 tokens | 截至 2023 年 10 月 | 输入:$0.15 / 1M tokens 输出:$0.6 / 1M tokens 图片价格:150px by 150px = $0.001275;低分辨率为$0.000425 |
输入:¥0.00105 / 1000 tokens 输出:¥0.0042 / 1000 tokens 图片价格:150px by 150px = ¥0.009;低分辨率为¥0.003 |
输入:$0.075 / 1M tokens 输出:$0.300 / 1M output tokens |
*Batch API 定价要求请求以批量形式提交。响应将在 24 小时内返回,可享受 50% 折扣。了解有关批量 API 的更多信息 ↗
OpenAI o1-preview
o1-preview 是针对需要广泛常识的复杂任务的新推理模型。该模型具有 128K 上下文和 2023 年 10 月的知识截止点。
模型 | 描述 | 上下文窗口 | 最大输出 tokens | 训练数据 | 官方价格表示 | 转为人民币价格表示 | Batch API 价格 |
---|---|---|---|---|---|---|---|
o1-preview | 指向 o1 模型的最新快照:o1-preview-2024-09-12 | 128,000 tokens | 32,768 tokens | 截至 2023 年 10 月 | - | - | - |
o1-preview-2024-09-12 | 最新 o1 模型快照 | 128,000 tokens | 32,768 tokens | 截至 2023 年 10 月 | 输入:$15.00 / 1M tokens 输出:$60.00 / 1M tokens |
输入:¥0.105 / 1000 tokens 输出:¥0.42 / 1000 tokens |
- |
o1-mini | 指向最新的 o1-mini 快照:o1-mini-2024-09-12 | 128,000 tokens | 65,536 tokens | 截至 2023 年 10 月 | - | - | - |
o1-mini-2024-09-12 | 最新 o1-mini 模型快照 | 128,000 tokens | 65,536 tokens | 截至 2023 年 10 月 | 输入:$3.00 / 1M tokens 输出:$12.00 / 1M tokens |
输入:¥0.021 / 1000 tokens 输出:¥0.084 / 1000 tokens |
- |
GPT-4 and GPT-4 Turbo
GPT-4 是一种大型多模态模型,能够接收文本或图片的输入,并输出文本。它能够解决比我们此前的模型更加复杂的问题,这得益于它更加广泛的通识知识和更高级的推理能力。
模型 | 描述 | 上下文窗口 | 最大输出 tokens | 训练数据 | 官方价格表示 | 转为人民币价格表示 |
---|---|---|---|---|---|---|
gpt-4-turbo | 最新版的 GPT-4 Turbo 模型新增了视觉功能,支持通过 JSON 模式和函数调用来处理视觉请求。该模型当前版本为 gpt-4-turbo-2024-04-09。 | 128,000 tokens | 4,096 tokens | 至 2023年12月 | - | - |
gpt-4-turbo-2024-04-09 | 带视觉功能的 GPT-4 Turbo 模型。现在,视觉请求能够通过 JSON 模式和函数调用来实现。gpt-4-turbo 目前版本就是这一版。 | 128,000 tokens | 4,096 tokens | 至 2023年12月 | 输入:$10.00 / 1M tokens 输出: $30.00 / 1M tokens 图片价格:150px by 150px = $0.00255;低分辨率为$0.00085 |
输入:¥0.07 / 1000 tokens 输出:¥0.21 / 1000 tokens 图片价格:150px by 150px = ¥0.018;低分辨率为¥0.006 |
gpt-4-turbo-preview | 目前指向 gpt-4-0125-preview。 | 128,000 tokens | 至 2023年12月 | - | - | |
gpt-4-0125-preview | 最新的 GPT-4 模型,旨在减少“懒惰”情况,即模型未完成任务。返回最多 4,096 个输出令牌。 | 128,000 tokens | 4,096 tokens | 至 2023年12月 | 输入:$10.00 / 1M tokens 输出:$30.00 / 1M tokens |
输入:¥0.07 / 1000 tokens 输出:¥0.21 / 1000 tokens |
gpt-4-1106-preview | GPT-4 Turbo 模型,具有改进的指令跟随、JSON 模式、可再现输出、函数调用等。返回最多 4,096 个输出令牌。这是预览模型。 | 128,000 tokens | 4,096 tokens | 至 2023年4月 | 输入:$10.00 / 1M tokens 输出: $30.00 / 1M tokens |
输入:¥0.07 / 1000 tokens 输出:¥0.21 / 1000 tokens |
gpt-4-vision-preview | 目前指向 gpt-4-1106-vision-preview | 128,000 令牌 | 至 2023年4月 | - | - | |
gpt-4-1106-vision-preview | 除了其他 GPT-4 Turbo 功能之外,该模型具备理解图像能力的 GPT-4。这是个预览模型,建议开发者使用 gpt-4-turbo,该模型同样具有图像能力。 | 128,000 tokens | 4,096 tokens | 至 2023年4月 | 输入:$10.00 / 1M tokens 输出: $30.00 / 1M tokens 图片价格:150px by 150px = $0.00255;低分辨率为$0.00085 |
输入:¥0.07 / 1000 tokens 输出:¥0.21 / 1000 tokens 图片价格:150px by 150px = ¥0.018;低分辨率为¥0.006 |
gpt-4 | 目前指向 gpt-4-0613。 | 8,192 tokens | 8,192 tokens | 至 2021年9月 | - | - |
gpt-4-0613 | gpt-4 从 2023年6月13日的快照,增强了函数调用支持。 | 8,192 tokens | 8,192 tokens | 至 2021年9月 | 输入: $30.00 / 1M tokens 输出: $60.00 / 1M tokens |
输入:¥0.21 / 1000 tokens 输出: ¥0.42 / 1000 tokens |
gpt-4-32k | 目前指向 gpt-4-32k-0613。这个模型从未广泛推出,以支持 GPT-4 Turbo。 | 32,768 tokens | - | 至 2021年9月 | - | - |
gpt-4-32k-0613 | gpt-4-32k 从 2023年6月13日的快照,增强了函数调用支持。这个模型从未广泛推出,以支持 GPT-4 Turbo。 | 32,768 tokens | - | 至 2021年9月 | 输入:$60.00 / 1M tokens 输出: $120.00 / 1M tokens |
输入:¥0.42 / 1000 tokens 输出: ¥0.84 / 1000 tokens |
GPT-3.5 Turbo
GPT-3.5 Turbo 模型可以理解并生成自然语言或代码,并已针对使用聊天完成 API 的聊天进行了优化,但也适用于非聊天任务。
模型 | 描述 | 上下文窗口 | 最大输出 tokens | 训练数据 | 官方价格表示 | 转为人民币价格表示 |
---|---|---|---|---|---|---|
gpt-3.5-turbo-0125 | 新 更新后的 GPT 3.5 Turbo 最新的 GPT-3.5 Turbo 模型,响应请求格式的准确性更高,并修复了一个导致非英语语言函数调用文本编码问题的错误。返回最多 4,096 个输出令牌。 |
16,385 tokens | 4,096 tokens | 至 2021年9月 | 输入:$0.50 / 1M tokens 输出: $1.50 / 1M tokens |
¥0.0035 / 1000 tokens 输出:0.0105 / 1000 tokens |
gpt-3.5-turbo | 目前指向 gpt-3.5-turbo-0125。 | 16,385 tokens | 4,096 tokens | 至 2021年9月 | - | - |
gpt-3.5-turbo-1106 | GPT-3.5 Turbo 模型,具有改进的指令跟随、JSON 模式、可重现输出、并行函数调用等。返回最多 4,096 个输出令牌。 | 16,385 tokens | 4,096 tokens | 至 2021年9月 | - | - |
gpt-3.5-turbo-instruct | 与 GPT-3 时代模型类似的能力。与遗留 Completions 端点兼容,不适用于 Chat Completions。 | 4,096 tokens | 4,096 tokens | 至 2021年9月 | 输入: $1.50 / 1M tokens 输出: $2.00 / 1M tokens |
输入:¥0.0105 / 1000 tokens 输出:¥ 0.014 / 1000 tokens |
gpt-3.5-turbo-16k | 遗留 目前指向 gpt-3.5-turbo-16k-0613。 | 16,385 tokens | 4,096 tokens | 至 2021年9月 | - | - |
gpt-3.5-turbo-0613 | 遗留 gpt-3.5-turbo 于 2023年6月13日的快照。将在 2024年6月13日停用。 | 4,096 tokens | 4,096 tokens | 至 2021年9月 | - | - |
gpt-3.5-turbo-16k-0613 | 遗留 gpt-3.5-16k-turbo 于 2023年6月13日的快照。将在 2024年6月13日停用。 | 16,385 tokens | 4,096 tokens | 至 2021年9月 | - | - |
图像模型
将 DALL·E 直接集成到您的应用中,以生成和编辑新颖的图像和艺术作品。DALL·E 3 是最高质量的模型,而 DALL·E 2 则经过优化以降低成本
模型 | 质量 | 分辨率 | 价格 |
---|---|---|---|
DALL·E 3 | 标准 | 1024x1024 | $0.040 / 图片 |
DALL·E 3 | 标准 | 1024x1792, 1792x1024 | $0.080 / 图片 |
DALL·E 3 | 高清 | 1024x1024 | $0.080 / 图片 |
DALL·E 3 | 高清 | 1024x1792, 1792x1024 | $0.120 / 图片 |
DALL·E 2 | 标准 | 1024x1024 | $0.020 / 图片 |
DALL·E 2 | 标准 | 512x512 | $0.018 / 图片 |
DALL·E 2 | 标准 | 256x256 | $0.016 / 图片 |
Embedding models
构建高级搜索、聚类、主题建模和分类功能,利用我们的嵌入服务。
模型 | 使用费用 | Batch API 价格 |
---|---|---|
text-embedding-3-small | $0.02 / 1M tokens | $0.010 / 1M tokens |
text-embedding-3-large | $0.13 / 1M tokens | $0.065 / 1M tokens |
ada v2 | $0.10 / 1M tokens | $0.050 / 1M tokens |
*Batch API 定价要求请求以批量形式提交。响应将在 24 小时内返回,可享受 50% 折扣。了解有关批量 API 的更多信息 ↗
Fine-tuning models
通过使用您的训练数据微调我们的基础模型,创建您自己的自定义模型。一旦您微调了一个模型,您将只需为向该模型发送请求时使用的 tokens 付费。
模型 | 价格 | 批处理 API 价格* |
---|---|---|
gpt-4o-mini-2024-07-18** | 输入:$0.30 / 1M tokens | 输入: $0.150 / 1M tokens |
输出:$1.20 / 1M tokens | 输出: $0.60 / 1M tokens | |
训练:$3.00 / 1M tokens | ||
gpt-3.5-turbo | 输入:$3.00 / 1M tokens | 输入: $1.50 / 1M tokens |
输出:$6.00 / 1M tokens | 输出: $3.00 / 1M tokens | |
训练:$8.00 / 1M tokens | ||
davinci-002 | 输入:$12.00 / 1M tokens | 输入: $6.00 / 1M tokens |
输出:$12.00 / 1M tokens | 输出: $6.00 / 1M tokens | |
训练:$6.00 / 1M tokens | ||
babbage-002 | 输入:$1.60 / 1M tokens | 输入: $0.80 / 1M tokens |
输出:$1.60 / 1M tokens | 输出: $0.80 / 1M tokens | |
训练:$0.40 / 1M tokens |
*Batch API 定价要求请求以批量形式提交。响应将在 24 小时内返回,可享受 50% 折扣。了解有关批量 API 的更多信息 ↗
**截至 2024 年 9 月 23 日,GPT-4o mini 的微调是免费的,但每日代币数量不得超过限额。每个符合条件的组织每天最多可获得 200 万个免费训练代币,超出部分将按 3.00 美元/100 万个代币的正常费率收费。
Assistants API
Assistants API 及其工具让开发者能够轻松地在他们的应用中构建 AI 助手。使用助手 API 的 token 按所选语言模型的每 token 输入/输出费率计费。
此外,我们对工具的使用收费如下:
工具 | 费用 |
---|---|
代码解释器 | $0.03 / 每次会话 |
文件搜索 | $0.10 / 每天每 GB 向量存储 (首个 1 GB 免费) |
GB 指二进制千兆字节(也称为 gibibyte),其中 1 GB 为 2^30 字节。
语音模型
Whisper 可以将语音转录为文本,并将多种语言翻译成英语。
文本转语音 (TTS) 可以将文本转换为语音音频。
模型 | 使用费用 |
---|---|
Whisper | $0.006 / 分钟(四舍五入到最接近的秒) |
TTS | $15.00 / 1M characters |
TTS HD | $30.00 / 1M characters |
其他旧模型
模型 | 使用费用 |
---|---|
davinci-002 | $2.00 / 1M tokens |
babbage-002 | $0.40 / 1M tokens |