アフィリエイト広告を利用しています

Whisper + Claude Code + Final Cut + Remotion でインタビュー動画編集をほぼ自動化した話

今、お仕事でインタビュー動画の編集を進めているのですが、今までみたいに手作業でやっているとめちゃくちゃ時間がかかってしまうんですよね。

今回のインタビュー動画、かなりの本数を編集する予定でして、なんとか今のAI、クロードを使ってできないかと思っていたんです。そしたら、合わせ技でいい方法を見つけました。もう、これはいい。

まず、動画を Whisper Transcription で文字起こしをしまして、字幕データの SRT というファイルがあるんですね。これ、時間とタイムライン、つまり時間とセリフが全部セットになっているファイルなんです。これを書き出して、 Claude Code で解釈させます。

AI VIDEO EDITING WORKFLOW

Whisper + Claude Code + FCP + Remotion
AI合わせ技 動画編集フロー

STEP 01 — 文字起こし
🎤
WHISPER TRANSCRIPTION

インタビュー動画を文字起こし

音声→テキスト変換。タイムライン付き字幕データを生成

.SRT
STEP 02 — 編集設計図の生成
🤖
CLAUDE CODE

SRTを解析 → FCP用XMLを生成

無音・フィラー音(あ、う)をカット。編集方針を指示してXMLを自動生成

.XML
STEP 03 — 粗編集
🎬
FINAL CUT PRO

XMLを読み込んで自動カット編集

30分の素材が2分に。設計図通りに編集済みで出来上がる

30分 → 2分
STEP 04 — 手作業微調整(ここだけ手動)
MANUAL WORK

微調整・確認

機械的処理の後、人の目で微調整。ここだけどうしても手作業が必要

STEP 05 — 再文字起こし
🎤
WHISPER TRANSCRIPTION(2回目)

編集済み動画を再度文字起こし

編集後の動画からタイムライン付きSRTを再生成。テロップの位置合わせに使う

.SRT
STEP 06 — テロップ自動生成
🤖
CLAUDE CODE

シーン切れ目にテロップデータを生成

プロジェクトX風の文字スライドを自動作成。フォント・サイズも指定可能

STEP 07 — テロップ挿入 & レンダリング
REMOTION

テロップを自動挿入してレンダリング

位置もサイズもバッチリ揃う。プレビューは不具合あるが書き出しは正常動作

完成 🎉
OUTPUT

テロップ入り編集動画の完成

手作業でやったら10倍かかっていた作業が、AIの合わせ技で爆速に

⏱ 作業時間 約 1/10 に短縮

いろいろ機能を試行錯誤して作ったのが、ファイナルカットの編集設計図のファイル。そのファイルの仕様を理解させているので、ファイナルカットの XMLファイル を書き出させることができるんです。このとき、内容も理解してくれますので、「こういう方向で編集したい」という指示も出せますし、無音の部分や「あ」「う」といった音もカットしてもらえます。

これがどういうことかといいますと、例えば30分の録画データでも、この編集設計図ファイルをファイナルカットで開くと、指定した時間、例えば2分にカットされて出来上がっているんですね。

とはいえ、機械的にやっていますから、ここから手作業での微調整は必要です。どうしても一度は手を入れる必要があるかなと感じています。

これで出来上がったら、もう一回動画を書き出しまして、今度この動画を再び Whisper TranscriptionSRTファイル に。文字と動画の中の時間、タイムラインが揃っているファイルを作ります。今度はそれで、各シーンの切れ目にスライドというか、テロップというか、プロジェクトX風の文字を自動で作らせて、それを Remotion で自動的に入れてもらってレンダリング・書き出し、という流れでやったら、かなりいい感じにできているんですよね。

これは良い方法だと思います。いい方法を見つけました。

ただ、一個だけ困っているのが、Remotion のプレビュー画面がうまく動かなくなってしまったんですよね。Claude Code の方でいろいろ触っていてバグが発生してしまいまして、Claude Code 自身も「バグです」と言うので、解消するように何度も試みたんですが、どんどん変になってしまって、プレビューで確認できなくなってしまいました。

ただ、レンダリングでの書き出しは正常に動いていますので、プレビューは今回は諦めて、Remotion で書き出すようにしています。

いやー、すごい時代ですよね。これを手作業でやっていたら、多分どれだけ時間がかかるんだろう、10倍くらいかかるんじゃないかなと思います。

しかもテロップやスライドの文字を入れるのって、意外と位置を合わせるのが大変なんですけども、この方法だったらバッチリ合うんですよね。文字のサイズも指定できますし、フォントはもちろんパソコンにあるフォントを指定できますので、いやーこれは本当にいい方法です。

この記事を書いた人

大東 信仁

カンパチが好きです。

プロフィールはこちら

10月14日開催 参加者募集中
(画像をタップ→詳細へ)

ミッションナビゲート モニター
(画像をタップ→詳細へ)

広告