この記事は、2024年5月13日(現地時間)にOpenAIが発表した最新モデルGPT-4oのAPI料金を反映した最新情報(2024年5月14日時点)に基づいています。
- 「OpenAI / ChatGPTのAPIの利用料金はいくら?」
- 「OpenAI / ChatGPTのAPIの利用料金はどのように計算されるの?」
- 「23年11月に新たにリリースされたAssistants APIやDALL-E3 APIの料金体系は?」
といった疑問をお持ちの方も多いのではないでしょうか?
この記事は、ChatGPT(OpenAI)のAPIの利用彫金について、GPT-4o、GPT-4 Turbo、GPT-4、GPT-3.5 Turbo、Fine-tunig、Embeddind、Assistants、DALL-E、Whisperなどの各モデルの最新の料金体系について詳しく解説します。
ぜひ、この記事を参考にしてChatGPT(OpenAI) APIを活用してみましょう。
目次
ChatGPT(OpenAI)のAPI料金体系
ChatGPT(OpenAI) APIの利用料金は、APIを利用した分だけ課金される従量課金です。
OpenAI APIには、GPT-4をはじめとした言語モデル、画像生成モデル、音声モデルなど様々なモデルがありますが、モデルごとに料金体系が異なります
この記事は、2024年5月13日(現地時間)に発表されたGPT-4oモデルも反映した2024年5月14日時点の最新情報をもとに、各モデルの料金体系についてわかりやすく解説します。
OpenAI API料金体系に関して、よくある質問も最後に掲載しているのでぜひ最後までご覧ください。
- GPT-4o
- GPT-4 Turbo
- GPT-4
- GPT-3.5 Turbo
- Assistants API
- Fine-tuning models
- Embedding models
- Base models
- 画像生成 DALL-E
- 音声認識 Whisper
では、以下で各モデルの料金体系を解説します。
言語モデル料金体系
OpenAIのGPT-4などの言語モデルの料金体系は、「1M tokens」=100万トークン当たりのの利用料金表示となっています。
「トークン」とは、単語の一部のようなもので、文字数と単語数の中間くらいのイメージです。英語の場合、100万トークンは約75万単語に相当します。
英語と日本語でトークン数のカウント方法は異なります。例えば、「apple」は1トークンですが、「りんご」は3トークンです。
「トークンについて詳しく知りたい」という方には、本記事後半の「Q.トークン(token)とはなんですか?」で詳しく解説しているので、ぜひ参考にしてみてください。
API利用料金のカウントで重要なポイントは、APIに入力したトークン数に対してのみ課金されるわけでなく、APIの出力結果(トークン数)に対しても課金されることです。
そのため、各言語モデルの料金表では、入力の料金と出力の料金がそれぞれ記載されています。
GPT-4o料金体系
GPT-4oは、2024年5月13日(現地時間)に発表された最新のマルチモーダルモデルで、GPT-4 Turboより高速で安価で、より強力なVision機能を備えた、OpenAIの最も先進的なマルチモーダルモデルです。
このモデルは128Kのコンテキストを持ち、2023年10月の知識カットオフを予定しています。
モデル | 入力 | 出力 |
gpt-4o | $5 / 1M tokens | $15 / 1M tokens |
gpt-4o-2024-05-13 | $5 / 1M tokens | $15 / 1M tokens |
GPT-4oの一つ前のモデル「GPT-4 Turbo」に比べると、入力も出力も料金が半額になっています。
計算例
・利用モデル:gpt-4oモデル
・入力:2百万トークン
・出力:4百万トークン
の場合、利用料金の計算は以下の通りです。
(入力の料金)2×$5 +(出力の料金) 4×$15
= $70
GPT-4 Turbo 料金体系
GPT-4 Turboは、23年11月のOpenAi DevDayで発表されたモデルで、2023年4月の知識カットオフとVision機能を備えた128Kのコンテキストで提供されるモデルです。
モデル | 入力 | 出力 |
gpt-4-turbo | $10 / 1M tokens | $30 / 1M tokens |
gpt-4-turbo-2024-04-09 | $10 / 1M tokens | $30 / 1M tokens |
GPT-4 料金体系
GPT-4は、広範な一般知識と専門知識を持ち、自然言語で複雑な指示に従い、正確性を持って難しい問題を解決することができます。
モデル | 入力 | 出力 |
gpt-4 | $30 / 1M tokens | $60 / 1M tokens |
gpt-4-32k | $60 / 1M tokens | $120 / 1M tokens |
GPT-3.5 Turbo 料金体系
GPT-3.5 Turboモデルは高性能でコストパフォーマンスに優れたモデルです。
gpt-3.5-turbo-0125はこのファミリーのフラッグシップモデルで、16Kのコンテキストウィンドウをサポートし、対話用に最適化されています。
gpt-3.5-turbo-instructはInstructモデルで、4Kのコンテキスト・ウィンドウのみをサポートしています。
モデル | 入力 | 出力 |
gpt-3.5-turbo-0125 | $0.5 / 1M tokens | $1.5 / 1M tokens |
gpt-3.5-turbo-instruct | $1.5 / 1M tokens | $2.0 / 1M tokens |
※24年1月25日にgpt-3.5-turbo-1106からgpt-3.5-turbo-0125にアップデートされ、利用料金が大幅に値下げされました。
Assistants API 料金体系
Assistants APIとツール(Code interpreter、File Search)は、開発者が自分のアプリケーション内でAIアシスタントを構築するのを容易にします。
アシスタントAPIに使用されるトークンは、選択された言語モデルのトークンごとの入力/出力料金で請求され、アシスタントはモデルを呼び出す際にスレッドからどのコンテキストを含めるかを選択します。
また、ツールの利用には以下の料金がかかります。
ツール | 入力 |
Code interpreter | $0.03 / session |
File Search | $0.10 / GB of vector-storage per day (1 GB free) |
Fine-tuning models 料金体系
学習用データを使用してOpenAIのベースモデルをファインチューニングすることで、独自のカスタムモデルを作成できます。モデルをファインチューニングすると、そのモデルへのリクエストで使用するトークンのみが請求されます。
モデル | 学習 | 入力 | 出力 |
gpt-3.5-turbo | $8.0 / 1M tokens | $3.0 / 1M tokens | $6.0 / 1M tokens |
davinci-002 | $6.0 / 1M tokens | $12.0 / 1M tokens | $12.0 / 1M tokens |
babbage-002 | $0.4 / 1M tokens | $1.6 / 1M tokens | $1.6 / 1M tokens |
Embedding models 料金体系
Embeddingモデルを使用することで、高度な検索、クラスタリング、トピックモデリング、分類機能を構築できます。
モデル | 使用 |
text-embedding-3-small | $0.02 / 1M tokens |
text-embedding-3-large | $0.13 / 1M tokens |
ada v2 | $0.10 / 1M tokens |
Base models 料金体系
GPT base modelは、指示に従うことに最適化されておらず、能力が低いですが、狭いタスクにファインチューニングされると効果的です。
モデル | 使用 |
davinci-002 | $2.0 / 1M tokens |
babbage-002 | $0.40 / 1M tokens |
画像生成モデル DALL-E 料金体系
DALL·Eは画像生成AIモデルです。
23年11月のOpenAI DevDayで、従来のDALL-E2よりも高性能で高品質なDALL-E3のAPI公開が発表されました。
DALL·E 3は最新の最高品質のモデルで、DALL·E 2は低コストに最適化されている旧ver.のモデルです。
DALL-E3などの画像生成モデルは、生成する画像の枚数ごとに画像解像度に応じて課金されます。
例えば、DALL-E3(Standard)で、1024×1024の画像を10枚作成すると約60円です。
モデル | Quality | 画像解像度 | 料金 |
DALL-E3 | Standard | 1024×1024 | $0.040 / image |
Standard | 1024×1792, 1792×1024 | $0.080 / image | |
DALL-E3 | HD | 1024×1024 | $0.080 / image |
HD | 1024×1792, 1792×1024 | $0.120 / image | |
DALL-E2 | 1024×1024 | $0.020 / image | |
512×512 | $0.018 / image | ||
256×256 | $0.016 / image |
音声モデル Whisper 料金体系
Whisperは、音声をテキストに書き起こす(文字起こし)ことができる音声認識モデルです。
TTS(Text To Speech)は、テキストを音声に変換することができる音声合成モデルです。
モデル | 使用 |
Whisper | $0.006 / minute (rounded to the nearest second) |
TTS | $15.0 / 1M characters |
TTS HD | $30.0 / 1M characters |
Whisperの料金計算方法
Whisperは時間単位で課金され、1分ごとに0.006ドル(約0.9円)です。
例えば、1時間の会議の音声を文字起こしすると約50〜60円です。
ChatGPT(OpenAI API 利用料金に関してよくある質問
Q.トークン(token)とはなんですか?
トークン(token)は、モデルが処理するテキストの単位で、単語の一部と考えることができます。
英語のテキストでは、1000トークンはおよそ750語(1トークンは0.75語)に相当します。
参考までに、シェイクスピアの全集は約900,000語、1.2Mトークンです。
ただし、日本語の場合は英語と異なり、1000トークン≒750単語ではないことに留意が必要です。
実際の文章のトークン数を知りたい場合は、OpenAIの公式サイトで提供されているTokenizerで、入力した文章からトークン数を計算することができます。
【あわせて読みたい】ChatGPTのトークン数とは?日本語と英語の違いも詳しく解説!
以下の記事でChatGPTのトークン数について、具体例付きで日本語と英語それぞれの特徴や違いについてわかりやすく解説しているので、ぜひ参考にしてみてください。
Q.どのモデルを利用したらいいですか?
使用するタスクの複雑さに応じて、gpt-4またはgpt-3.5-turboのいずれかを使用することが推奨されます。gpt-4は幅広い評価で一般的に優れたパフォーマンスを発揮しますが、gpt-3.5-turboはレイテンシーが低く、トークンあたりのコストもはるかに低いです。
これらのモデルをPlaygroundで実験し、使用目的に照らしてパフォーマンスとコスト面のバランスを評価してモデルを選択するとよいでしょう。
Q.毎月どれだけのトークンを使用したかどのように把握できますか?
OpenAIのアカウントにログインして、使用状況のトラッキングダッシュボードを表示してください。
このページでは、現在および過去に使用したトークンの数が表示されています。
Q.支払額を管理するにはどうすればいいですか?
OpenAIのアカウントにログインして、月の上限支払金額を設定することができます。
また、月の利用金額が一定金額以上に達した場合にメールでアラートを受け取る設定も可能です。
設定方法については、以下の記事で画像付きで詳しく解説しているのでぜひ参考にしてみてください。
Q.ChatGPT APIは「ChatGPT Plus」に含まれていますか?
いいえ、ChatGPT APIと「ChatGPT Plus」は別々に請求されます。
「ChatGPT Plus」は月額$20の固定料金ですが、ChatGPT APIは使用した分だけ課金される従量課金です。
Q.Playgroundの使用は使用限度額(quota)の計算にカウントされますか?
はい、Playgroundでの使用も通常のAPI使用と同様に扱われます。
Q.APIへのリクエストの料金はどのように計算されますか?
APIへのリクエストの料金は、APIに送信された入力トークンの数とAPIによって返された出力のトークン数に基づいて請求されます。
最も単純なケースで計算すると、プロンプト(input)に200トークン含まれており、gpt-3.5-turbo-1106 APIから900トークンの出力をリクエストした場合、リクエストは1100トークン(200 token/input + 900token/output)を使用し、費用は [(200 * $0.001) + (900 * $0.002)] / 1000 = $0.002 になります。
プロンプトの長さを短くする、最大応答長を制限する、best_of/nの使用を制限する、適切なストップシーケンスを追加する、またはトークンあたりのコストが低いエンジンを使用することで、コストを抑えることができます。
Q.Fine-tuningの料金はどのように計算されますか?
Fine-tuningの料金には、学習(training)と使用(usage)の2つの要素があります。
ファインチューニングモデルを学習する際には、使用された合計のトークン数が学習(training)料金に基づいて請求されます。学習トークンの数は、学習データセット内のトークンの数と選択した学習エポック数に依存することに注意してください。デフォルトのエポック数は4です。
合計の学習トークン=学習ファイル内のトークン数 × トレーニングエポック数
一度モデルをファインチューニングすると、使用するトークンのみが請求されます。
ファインチューニングされたモデルへのリクエストは、使用(usage)の料金表で計算され請求されます。
Q.それぞれのモデルにSLAはありますか?
現時点ではSLAはありませんが、近日中にOpenAIがSLAを公開する予定です。
Q.APIはMicrosoft Azureで利用可能ですか?
はい。Azure上でOpenAI APIにアクセスして利用できます。
【あわせて読みたい】OpenAIのアカウント作成方法
OpenAI APIを利用するには、まずはOpenAIのアカウントを作成しましょう。
アカウントは、どなたでも無料で簡単に作成することができます。
OpenAIのアカウント作成方法は、以下の記事で全ての手順を画像付きで詳しく解説しているのでぜひ参考にしてみてください。
【あわせて読みたい】OpenAI APIキーの取得方法
OpenAI APIを利用するには、APIキーを取得する必要があります。
APIキーの取得は誰でも無料で簡単に取得できます。
OpenAI APIキーの取得方法は、以下の記事で画像付きでわかりやすく解説しているので、ぜひ参考にしてみてください。
まとめ
この記事では、ChatGPT(OpenAI) APIの最新の料金体系についてまとめました。
OpenAIのAPIを利用すると、PythonやExcelなど外部ツール等との連携が容易に出来るようになりChatGPTの活用の幅がより一層広がり業務効率がアップしますので、ぜひ試してみてください。
「ChatGPTマガジン」を運営するゴートマン合同会社は、
・生成AIを活用した新規事業開発支援
・生成AIの受託開発
・生成AIの技術顧問
など大企業から中小企業まで幅広くご支援しています。
まずは無料相談してしてみましょう。