声景メディア
音声日記の始め方

音声日記をAIで自動化するシステムの作り方と実際の使用感

「音声日記を続けているけど、聴き返す時間がない」「録りっぱなしで活用できていない」——そんな悩みを解決するのが、AIを使った音声日記の自動化システムです。この記事では、録音→文字起こし→要約→アーカイブまでを自動で行う仕組みの作り方と、実際に使ってみた感想を紹介します。

自動化する工程とツール

音声日記の自動化で最も効果的なのは以下の4工程です。

工程1:録音(手動)

録音だけは手動です。スマホのボイスメモアプリ、または専用の音声日記アプリを使います。大切なのは、録音後のファイルが自動でクラウドに同期される設定にしておくことです(iCloudやGoogle Drive)。

工程2:文字起こし(自動化可能)

Whisperを使ったローカル処理や、NotionのAI文字起こし機能、Notta、Otter.aiなどのサービスで自動化できます。クラウドに同期された音声ファイルを定期的にスキャンして文字起こしするワークフローをZapierやMake(旧Integromat)で組むことができます。

工程3:要約・タグ付け(自動化可能)

文字起こしされたテキストをClaude・ChatGPTのAPIに渡して、以下の処理を自動化できます:

  • 3行要約の生成
  • テーマ・感情・キーワードの自動タグ付け
  • 「今日の気づき」の抽出

工程4:アーカイブ(自動化可能)

NotionやObsidianのデータベースに日付・要約・タグと一緒に自動保存。月ごとのページに自動整理されます。

実際に組んでみた構成と感想

最もシンプルな自動化構成は以下です:

iCloudのボイスメモ → Whisper(ローカル or API)→ Claude API(要約・タグ)→ Notion

実際の感想(体験談として):

  • 文字起こしの精度は日常会話で85〜90%程度。専門用語や独り言形式だと精度が落ちる
  • 要約は「あー」「えーと」が除去されてすっきりした内容になる。1ヶ月後に読み返したとき、何を話したか一発でわかる
  • APIコストは月間30分の音声なら数百円以内に収まる
  • セットアップに1〜2時間かかるが、一度組めばほぼ自動で動く

技術的なハードルが高い場合の代替手段

自動化スクリプトを組むのが難しい場合は、以下の手動セミオート方法でも十分です:

方法A:Notionのオーディオ機能を使う

NotionのページにボイスメモをドラッグするとAI文字起こしが走ります。その後、AIで要約させる操作だけ手動で行います。

方法B:音声日記専用アプリを使う

OtterやNottaなどの音声日記・会議録アプリは、録音→文字起こし→検索が一体化しています。APIを組まずに済みます。

声景編集部の見解

自動化の目的は「楽をする」ではなく「活用できる状態にする」ことです。録りっぱなしのデータは価値がゼロに近いですが、要約・タグ付きのアーカイブは1年後でも検索・参照できる知的資産になります。

声景について

声景(Koekei)は、録音しながらAIがリアルタイムで「問いのカード」を差し込むジャーナリングツールです。録音中からAIが深掘りを手伝うため、「録りっぱなし問題」を根本から解決するアプローチを取っています。現在β版のウェイトリストを受け付けています。

まとめ

  • 音声日記の自動化は録音→文字起こし→要約→アーカイブの4工程で組める
  • Whisper + Claude API + Notionの組み合わせがシンプルで実用的
  • 技術的に難しい場合はNotionのAI機能や専用アプリで半自動化から始められる

声景のβ版に先行登録する → https://koekei.com

声景(Koekei)β版

録音しながらAIが思考を深める問いを届ける

波の音が入ったら「この景色を見てどう感じましたか?」、沈黙が続いたら「今、何を考えていますか?」—— 声と映像から文脈を読んで、内省を深める問いをリアルタイムで返します。

β版のウェイトリストに登録する