今回はOpenAIが提供しているChatGPT APIとWhisper APIという2つのAPIを用いて議事録文字起こしアプリケーションを作り、Hugging Face Spacesで公開してみます。
OpenAI APIを使う準備
まずはAPIを使えるようにします。OpenAIのPlatformにアクセスして、サインアップを行います。
OpenAIのアカウント新規作成ページ
メールアドレス等を入力しアカウント認証を済ませたら、API Keysページにアクセスしてください。
APIキー作成ページ
上図のCreate new secret keyをクリックすると新しいAPIキーが作成されます。これでChatGPT APIやWhisper APIを使えるようになりました。
ChatGPT APIの料金
ChatGPT APIを使うわけですが、この料金は2023年4月1日現在gpt-3.5-turboモデルで$0.002/1K tokensとなっています。ただし、このtokenというのはTokenizer(文字列を分割するモジュール)依存です。
たとえば、「こんにちは!今日は良い天気ですね。洗濯物がよく乾きそうです。」という文字列をOpenAIが公開しているGPT-3 Tokenizerで分割すると、以下のようになります。
「こんにちは!今日は良い天気ですね。洗濯物がよく乾きそうです。」という文字列をGPT-3 Tokenizerに入れると30文字で47トークンになっている
英語に翻訳した「Hello! It's a beautiful day today. The laundry is likely to dry well.」を同じくGPT-3 Tokenizerにかけると以下のようになります。
「Hello! It's a beautiful day today. The laundry is likely to dry well.」という文字列をGPT-3 Tokenizerに入れると69文字で17トークンになっている
なお、手元でテストしたところ、Tokenizerによる言語間の不公平さは2.5倍程度の開きがあったものの、GPT-3.5やGPT-4で徐々に解消されつつあり1.5倍程度まで下がっています。
まとめると、目安としては、1k tokens = 750文字程度と考え、GPT-3.5-turboを日本語で使う場合は以下のような金額感で覚えておけば良いでしょう。
APIに入出力される合計文字数
750字
1,000字
GPT-3.5-Turbo
0.27円
0.36円