【24年最新版】Azure OpenAI Serviceの料金体系まとめ
- 「Azure OpenAI Serviceの利用料金はいくら?」
- 「Azure OpenAI Serviceの利用料金どのように計算される?初期費用はかかる?」
- 「OpenAI APIの利用料金とは違う?」
といった疑問をお持ちの方も多いのではないでしょうか?
この記事は、Microsoftが提供するAzure OpenAI Serviceの利用彫金について、OpenAI APIとの違いも含めて詳しく解説します。
この記事がAzure OpenAI Serviceの導入・活用の参考になれば幸いです。
目次
Azure OpenAi Serviceの料金体系
Azure OpenAI Serviceの料金体系は、
- 利用した分だけ課金される従量課金
- モデルによって料金は異なる
- 初期費用はなし
と、なっています。
これは、OpenAI APIの料金体系と同じです。
Azure OpenAI Serviceでは、OpenAiと同じように以下のようなモデルが利用可能ですが、
- GPT-4 Turbo
- GPT-4
- GPT-3.5 Turbo
- Assistants API
- Fine-tuning models
- Embedding models
- Base models
- 画像生成 DALL-E
- 音声認識 Whisper
これらのモデルの料金について、以下で解説します。
なお、Azure OpenAI Serviceの料金はリージョンによって異なることがあります。以下は特段の断りがない限り、東日本リージョンの料金を紹介します。
全て記事執筆時点の情報になりますので、最新情報については以下の公式ページをご確認ください。
参考:Azure OpenAI Service の価格(公式)
Azure OpenAI Serviceについて、詳しく知りたい方は以下の記事をごください。
関連記事:Azure OpenAI Serviceとは?何ができるのか、メリット、使い方をわかりやすく解説!
言語モデル料金体系
Azure OpenAI Serviceの言語モデルの料金体系は、「1K tokens」=1000トークン当たりのの利用料金となっています。
「トークン」とは、単語の一部のようなもので、文字数と単語数の中間くらいのイメージです。英語の場合、1000トークンは約750単語に相当します。
英語と日本語でトークン数のカウント方法は異なります。例えば、「apple」は1トークンですが、「りんご」は3トークンです。
「トークンについて詳しく知りたい」という方には、本記事後半の「Q.トークン(token)とはなんですか?」で詳しく解説しているので、ぜひ参考にしてみてください。
利用料金のカウントで重要なポイントは、入力したトークン数に対してのみ課金されるわけでなく、出力結果(トークン数)に対しても課金されることです。
そのため、各言語モデルの料金表では、入力の料金と出力の料金がそれぞれ記載されています。
言語モデルの料金体系は下表の通りです。
モデル | 入力 | 出力 |
---|---|---|
GPT-3.5-Turbo(4K) | $0.0015 /1K tokens | $0.002 /1K tokens |
GPT-3.5-Turbo(16K) | $0.003 /1K tokens | $0.004 /1K tokens |
GPT-3.5-Turbo-1106(16K) *1 | $0.001 /1K tokens | $0.002 /1K tokens |
GPT-4-Turbo(128K) *1 | $0.01 /1K tokens | $0.03 /1K tokens |
GPT-4-Turbo-Vision(128K) *1 | $0.01 /1K tokens | $0.03 /1K tokens |
GPT-4(8K) | $0.03 /1K tokens | $0.06 /1K tokens |
GPT-4(32K) | $0.06 /1K tokens | $0.12 /1K tokens |
*1)これら3モデルは東日本リージョンは「該当なし」のため、米国西部リージョンの料金を掲載。
言語モデルの料金は、OpenAIの料金と同じです
なお、OpenAIの言語モデルの最新モデルGPT-4 TurboシリーズはOpenAI APIでは使用できますが、Azure OpenAi Serviceではプレビュー版(本番公開前の試用版)のみとなっており、一部リージョンのみ使用可能です。
計算例
・利用モデル:GPT-4(8K)モデルで、
・入力:2,000トークン
・出力:4,000トークン
の場合、利用料金の計算は以下の通りです。
(入力の料金)2000×$0.03 /1000 +(出力の料金) 4000×$0.06 /1000
= $0.3
Assistants API 料金体系
Assistants APIは、開発者が自分のアプリケーション内でAIアシスタントを構築するのを容易にします。
Assistants APIに使用されるトークンは、選択された言語モデルのトークンごとの入力/出力料金で請求され、アシスタントはモデルを呼び出す際にスレッドからどのコンテキストを含めるかを選択します。
なお、OpenAI APIでは、Assistants APIとしてCode interpreterとRetrievalの2つのツールが提供されていますが、Azure OpenAi Serviceでは現時点でCode interpreterのみ利用可能です。
料金はOpenAI APIと同じです。
ツール | 入力 |
Code interpreter | $0.03 / session |
Base models 料金体系
Base modelsは、指示に従うことに最適化されておらず、能力が低いですが、狭いタスクにファインチューニングされると効果的です。
料金はOpenAI APIと同じです。
モデル | 使用 |
davinci-002 | $0.0020 / 1K tokens |
babbage-002 | $0.0004 / 1K tokens |
Fine-tuning models 料金体系
学習用データを使用してOpenAIのベースモデルをファインチューニングすることで、独自のカスタムモデルを作成できます。
Fine-tuning modelsの料金体系は唯一、OpenAI APIと計算方法が異なります。
主な違いは以下です。
- OpenAI APIは、トレーニングに使用したトークン数に対して課金
- Azure OpenAi Serviceは、トレーニングに要した時間に対して課金
- Azure OpenAi Serviceででは、モデルのホスティング料金が課金される
モデル | トレーニング*1 | ホスティング*2 | 入力 | 出力 |
---|---|---|---|---|
davinci-002 | $40 / 1時間 | $2 / 1時間 | $0.002 / 1K tokens | $0.002 / 1K tokens |
babbage-002 | $34 / 1時間 | $1.70 / 1時間 | $0.0004 / 1K tokens | $0.0004 / 1K tokens |
GPT-3.5-Turbo (4K) | $45 / 1時間 | $3 / 1時間 | $0.0015 / 1K tokens | $0.002 / 1K tokens |
GPT-3.5-Turbo (16K) | 該当なし | 該当なし | 該当なし | 該当なし |
*1)コンピューティング時間あたりのトレーニング
*2)1 時間あたりのホスティング
Embedding models 料金体系
Embeddingモデルを使用することで、高度な検索、クラスタリング、トピックモデリング、分類機能を構築できます。
OpenAI APIでは、Adaモデルに加えて、
- text-embedding-3-small
- text-embedding-3-large
の2つの最新モデルがリリースされていますが、Azure OpenAi Serviceではまだ利用できません。
Adaモデルの料金はOpenAI APIと同じです。
モデル | 使用 |
Ada | $0.00010 / 1K tokens |
画像生成モデル DALL-E 料金体系
DALL·E(ダリ)は画像生成AIモデルです。
画像生成モデルは、生成する画像の枚数ごとに画像解像度に応じて課金されます。
例えば、DALL-E3(Standard)で、1024×1024の画像を100枚作成すると4ドル(約600円)です。
モデル | Quality | 画像解像度 | 料金 |
DALL-E3 | 標準 | 1024×1024 | $4 / 100 image |
標準 | 1024×1792, 1792×1024 | $8 / 100 image | |
DALL-E3 | HD | 1024×1024 | $8 / 100 image |
HD | 1024×1792, 1792×1024 | $12 / 100 image | |
DALL-E2 | 標準 | 1024×1024 | $2 / 100 image |
DALL-Eモデルは、現在プレビュー版で、東日本リージョンでは利用できません。
DALL-E3モデルはスウェーデン中部のみ、DALL-E2モデルは米国東部のでみ利用可能となっており、上記料金はそれらのリージョンの利用料金を掲載しています。
料金は、OpenAI APIと同じ料金です。
音声モデル Whisper 料金体系
Whisperは、音声をテキストに書き起こす(文字起こし)ことができる音声認識モデルです。
TTS(Text To Speech)は、テキストを音声に変換することができる音声合成モデルです。
モデル | 使用 |
Whisper | $0.36 / 時間 |
TTS | $15 / 1M characters |
TTS HD | $30 / 1M characters |
音声モデルは、現在プレビュー版で、東日本リージョンでは利用できません。
Whisperモデルは米国中北部、西ヨーロッパのみ、TTSモデルは米国中北部でのみ利用可能です。
上記料金は米国中北部リージョンの利用料金を掲載しています。
料金は、OpenAI APIと同じ料金です。
Whisperの料金計算方法
Whisperは時間単位で課金され、1時間あたり0.36ドルなので、
例えば、1時間の会議の音声を文字起こしすると約50〜60円です。
Azure OpenAI Service料金に関してよくある質問
Q. OpenAI APIの料金体系はどこで確認できますか?
OpenAI APIの料金体系については、以下の記事で詳しく解説しているので参考にしてみてください。
OpenAI公式の最新情報については、以下でご確認ください。
参考:OpenAIのAPI料金ページ
Q.トークン(token)とはなんですか?
トークン(token)は、モデルが処理するテキストの単位で、単語の一部と考えることができます。
英語のテキストでは、1000トークンはおよそ750語(1トークンは0.75語)に相当します。
参考までに、シェイクスピアの全集は約900,000語、1.2Mトークンです。
ただし、日本語の場合は英語と異なり、1000トークン≒750単語ではないことに留意が必要です。
実際の文章のトークン数を知りたい場合は、OpenAIの公式サイトで提供されているTokenizerで、入力した文章からトークン数を計算することができます。
【あわせて読みたい】ChatGPTのトークン数とは?日本語と英語の違いも詳しく解説!
以下の記事でChatGPTのトークン数について、具体例付きで日本語と英語それぞれの特徴や違いについてわかりやすく解説しているので、ぜひ参考にしてみてください。
Q. Azure OpenAI ServiceとOpenAI APIの違いは何ですか?
Azure OpenAI ServiceとOpenAI APIの違いについて、可用性/安定性、セキュリティ/データ保護、サポート、導入方法など計17の項目について、以下の記事で詳しく比較・解説しているのぜひ参考にしてみてください。
まとめ
この記事は、Azure OpenAI Serviceの料金体系について解説しました。
まとめると、以下の通りです。
まとめ
・利用した分だけ課金される従量課金
・モデルによって料金は異なる
・初期費用はなし
・各モデルの料金は、基本的にOpenAi APIの料金と同じ
・Fine-tuningモデルのみ料金の計算方法が異なる
この記事が、Azure OpenAI Serviceの導入・活用の参考になれば幸いです。
ChatGPTマガジンを運営するゴートマン合同会社は、生成AI特化のコンサルティング・開発会社として、
・Azure OpenAI Serviceの導入・活用支援
・Azure OpenAI Serviceを活用した開発
・生成AIを活用したサービス開発・新規事業創出支援
の豊富な実績を有しています。
ご興味のある企業様は、お気軽に無料相談ください。