声景メディア
音声日記の始め方

Claude・WhisperでAI音声日記パイプラインを無料で構築する手順

著者声景編集部·

Claude・WhisperでAI音声日記パイプラインを無料で構築する手順

「お金をかけずにAI音声日記を始めたい」という声はよく聞きます。OpenAIのWhisperはオープンソースのモデルをローカルで動かすことができ、ClaudeはAPIの無料枠や無料プランを活用できます。本記事ではコストを最小限に抑えたAI音声日記パイプラインの構築手順を解説します。

Whisperのローカル環境を整える

OpenAIが公開しているWhisperはPythonで動くオープンソースの音声認識モデルです。ローカルで動かすことでAPIコストをゼロにできます。セットアップは次の手順です。まずPythonとpipがインストールされていることを確認します。次にpip install openai-whisperを実行します。日本語の文字起こしにはwhisper audio.mp3 --language jaというコマンド一行で対応できます。

モデルサイズはtiny・base・small・medium・largeから選べます。精度と処理速度のバランスを考えると、まずsmallから始めるのが現実的です。M1/M2チップのMacであれば処理速度も十分実用的です。

ClaudeのAPIまたは無料プランを使う

WhisperでテキストT化した音声日記をClaudeで分析する際、Claude.aiの無料プランを使えばAPIコストも発生しません。テキストをClaudeのチャット画面に貼り付けて「この日記の要点をまとめて」「今日の感情の傾向を分析して」と依頼するだけで分析が始まります。

より自動化を進めたい場合はClaude APIを利用します。無料枠を使い切った後は従量課金ですが、個人の音声日記1本あたりのコストは数円程度に収まることが多いです。

パイプラインをシェルスクリプトで自動化する

録音ファイルを所定のフォルダに入れると自動でWhisperが動いてテキストファイルを出力する仕組みを作ると、手動の手間が大幅に減ります。macOSであればAutomatorを使ってフォルダアクションとして設定する方法、Pythonスクリプトで監視する方法などがあります。出力されたテキストはMarkdownファイルとして保存し、日付でフォルダ管理すると後から検索しやすくなります。声景はこうした技術スタックをユーザー体験として凝縮したAI音声ジャーナリングツールです。

声景編集部の見解

無料で構築できるパイプラインは「試す」段階に最適です。動かしながら自分に必要な機能が見えてきたら、その時点で有料ツールや有料APIへの移行を検討しましょう。


「書く日記は続かない」「何を話せばいいかわからない」——そんな悩みに応えるのが声景(Koekei)です。声を録るだけで、AIが文脈を読んで問いを返してくれるから、自然と思考が深まります。音声ジャーナリングをもっとやさしく始めたい方に。β版ウェイトリスト受付中 → https://koekei.com

まとめ

Whisperをローカルで動かしてClaudeの無料プランと組み合わせれば、ゼロコストのAI音声日記パイプラインが構築できます。まずシンプルな構成で動かしてみて、必要に応じて拡張していきましょう。β版先行登録 → https://koekei.com

β版 ウェイトリスト受付中

声に出した瞬間から、アイデアは走り出す。

声景は、話しながら考える人のための発散特化型AIインターフェース。 β版のウェイトリストに登録すると、リリース時に最優先でご案内します。