声景メディア
音声日記の始め方

ClaudeのHumanizerスキルで音声認識テキストを自然な日本語に直す方法

著者声景編集部·

ClaudeのHumanizerスキルで音声認識テキストを自然な日本語に直す方法

Whisperなどの音声認識AIは高精度ですが、文字起こしされたテキストはそのまま読みにくいことが多いです。句読点がない・話し言葉のフィラー(「えーと」「あの」)が残る・段落が切れていない——これらを人力で直すと時間がかかります。ClaudeのHumanizerスキルを使うと、音声認識テキストを自然な読み物に自動変換できます。

音声認識テキストが読みにくい典型的な理由

Whisperの文字起こしが読みにくくなる原因は主に3つです。

句読点の欠如または誤配置: 話し言葉には「文の終わり」を示す明示的なサインがないため、文字起こしに句読点が適切に入らないことがあります。

フィラーワードの残存: 「えーと」「あのー」「まあ」「なんか」などの話し言葉特有の表現がそのまま残ります。

非線形な思考の反映: 話しながら考えると、文が途中で方向転換したり、同じ内容を言い換えたりすることがあります。これが文字になると読みにくい構造になります。

ClaudeのHumanizerスキルとは何か

「Humanizer」スキルとは、AIが生成した・または機械的に見えるテキストを、より自然で人間的な文章に変換するClaudeの能力のことです。音声認識テキストへの適用では、具体的に以下の変換を依頼できます。

自然な句読点の追加: 意味の区切りに句読点・読点を適切に配置する

フィラー除去: 話し言葉特有の不要な表現を削除しつつ、意味を保持する

構造化: 段落分け・話題の区切りの明示化

語調の調整: 口語から自然な書き言葉への変換(命令調にならない範囲で)

実際の変換プロンプトの例

Claudeへの依頼文の例を示します。

「以下は音声日記の文字起こしです。句読点を適切に追加し、「えーと」「あの」などのフィラーを除去し、自然な段落に整理してください。ただし、私の言葉のリズムや語り口はできるだけ保持してください。」

この後に文字起こしテキストを貼り付けます。「私の語り口を保持してください」という一言が、単なる機械的な清書ではなく個性を残した変換を実現するポイントです。

変換後テキストの活用法

整理されたテキストはObsidianやNotionの日記ノートに貼り付けるほか、ブログ記事の下書き・SNS投稿のネタ・週次レビューのサマリーとして活用できます。話した内容が記録資産に変わる効率が大幅に上がります。

声景編集部の見解

声景は録音から問いかけまでをシームレスに行いますが、文字化されたテキストをさらに整理したい場合はClaudeのHumanizerスキルと組み合わせる使い方がおすすめです。話す→AIが問いを返す→さらに話す→テキスト化→Humanizerで整形というフローで、思考が一つのまとまったドキュメントになります。


声景(Koekei)は、録音しながらAIがリアルタイムで「問いのカード」を差し込むジャーナリングツールです。声と映像から文脈を読んで、思考を深める問いを返してくれます。現在β版のウェイトリストを受け付けています。


音声認識テキストのHumanizer変換は、句読点追加・フィラー除去・構造化・語調調整の4つを一度にClaudeに依頼することで実現します。「私の語り口を保持してください」の一言がポイントです。音声日記を記録資産に変えるパイプラインとして活用してみてください。

声景のβ版に先行登録する → https://koekei.com

β版 ウェイトリスト受付中

声に出した瞬間から、アイデアは走り出す。

声景は、話しながら考える人のための発散特化型AIインターフェース。 β版のウェイトリストに登録すると、リリース時に最優先でご案内します。