AIを利用した開発をしていると、一番の気になるところはAPI利用の課金となる。規模がデカくなれば専用契約となるだろうが、スモールスタート時は負担額がどの程度までかはサービスを左右する大きな位置づけになる。
OpenAI API の利用料金は「使用したトークン数 × モデルごとの単価」で計算されます。以下に概要と、注意すべき点を整理します。
🔍 モデル別の単価例
例えば:
- あるモデルで入力1,000,000トークンあたり $2.50、出力1,000,000トークンあたり $10.00。Holori+2Medium+2
- 安価モデルでは入力1,000,000トークンあたり $0.15、出力1,000,000トークンあたり $0.60。Wise+1
⚠️ 注意すべき観点
- 会話の文脈(過去のやりとり)を大量に送ると「入力トークン数」が増えてコストが高くなります。
- 出力を長く設定(例:要約+詳細説明)すると「出力トークン数」が増え、コストが跳ね上がります。
- モデルの選択によって、同じトークン数でもコストに大きな差があります(高性能モデル=高単価)。
- キャッシュなどで再利用できる応答を減らすことで、トークン使用を抑える設計がコスト削減に直結します。
🎯 あなたのシステム設計への活用ポイント
「人生史AI」の設計では:
- プロンプト(過去会話)を最小化して入力トークン数を抑える。
- 出力トークン数(AIの返答)に上限を設けて長すぎる生成を避ける。
- 高性能モデルは「本当に価値のある場面」でだけ使い、分析など単純処理には安価なモデルを使う。
- 同じ質問・応答の組み合わせがあれば「キャッシュ」して再利用し、AI呼び出しを減らす。
- モデル選択・単価を常に見直し、規模が大きくなったら単価/トークン最適化の設計を進める。
ロジックで判断できることを、わざわざAIに任せない。いや、AIに任せてはいけない部分を明確にして、ロジックで判断することにしておかないと痛い目に合う部分は多い。
例えば、AIを利用している場合には、チャットシステムと生成AIという構成がわかると思います。
■ AIチャットとは
- 画面に対話を表示するための「UI」そうユーザインタフェースがチャット
- AIが返す 情報(JSON形式) を解釈して会話制御する「ロジック」
- 対話ログをDB保存する「セッション管理」
■ 生成AIとは
- 質問を作る
- 要約する
- 意図を分析する
- 感情やフェーズ進捗を判定する
- 差分を検出する
→ “会話ではなく 内部処理として使うAI”。
■ 仕組みとは
- プログラムがプロンプトを出力して、それをAIに認識させる。
- データ(会話、進捗)をもとにプロンプト生成する
- OpenAI APIに投げる
- 構造化された結果Structured JSON を返して、それをもとに、アプリを制御する
- チャットへ表示する
ようするに、単にAIに丸投げしてもできるけど、それはコストが高くつくし、そもそも思いもしない結果で混乱を招くことになる。
まあ、あれだね。人間社会でもAI社会でも同じだけど、なんでも丸投げでいいように使おうとするとコストがかかるのは同じだね。
でね。AIの世界の評価を見ていると思うのだけれど、生成AIは凄い。とか、AIはすごいというけれど、LLMという大規模言語モデルが基本にあり、そのなかでも、特に日本語を扱うことができるようになったことと、日本語自体の素晴らしさを評価したい。
日本語というのは、その一文だけでは全体を把握できない場合もある。前後の文章のつながり。もっといえば、過去の話。すべてが関係性をもって、意味を成す場合もある。
その話は、また別途しよう。