波形を見なくても「文字を消すだけ」で音声・動画が編集できる革命ツール「Descript」。
ポッドキャスト・YouTube・研修動画・Zoom収録など、あらゆるコンテンツの編集が驚くほど速くなります。
このガイドでは、インポートから書き出し、AI 音声クローン・画面録画まで、完全初心者向けに1ステップずつ解説します。
目次
Descriptとは何か?他ツールとの違い
Descriptは、音声・動画を「文字原稿のように編集」するクロスプラットフォームツールです。
波形を調整する必要がなく、文字を削除するだけで音声・動画がカットされます。
✅ 文字を編集するだけで音声・動画をカット
✅ フィラーワード(えーと・あのー)ワンクリック削除
✅ AI音声クローン(Overdub)で後から修正可能
✅ 画面録画・動画編集まで一括対応
✅ 文字起こし・字幕自動生成
✅ フィラーワード(えーと・あのー)ワンクリック削除
✅ AI音声クローン(Overdub)で後から修正可能
✅ 画面録画・動画編集まで一括対応
✅ 文字起こし・字幕自動生成
DaVinci Resolveのような高度な編集はできませんが、
ポッドキャスト・YouTube・研修動画など「解説系コンテンツ」に最適化されています。
アカウント登録・インストール
Descript公式サイトから無料登録できます。クレジットカードは不要です。
・無料プラン:月1時間の文字起こし、基本機能を利用可能
・Creatorプラン:$24/月~(月10時間文字起こし、Overdub・画面録画無制限)
・Proプラン:$40/月~(文字起こし無制限、チーム機能)
・Creatorプラン:$24/月~(月10時間文字起こし、Overdub・画面録画無制限)
・Proプラン:$40/月~(文字起こし無制限、チーム機能)
ブラウザ版もありますが、長時間編集は安定性の高いデスクトップアプリを推奨します。
最低8GBメモリ環境が快適です。
最初のプロジェクト作成
アプリを起動し「New Project」をクリック。
名前は「番組名-日付-ゲスト名」など、後から検索しやすい名前にしましょう。
画面は「Googleドキュメント+動画編集ソフト」のようなインターフェースですが、
ほとんどの操作を「文字エリア」だけで完結できます。
音声・動画のインポート
ファイルをドラッグ&ドロップするだけでインポート完了。
MP3・WAV・MP4・MOVなど、一般的なフォーマットに対応しています。
インポートと同時に自動で文字起こしが開始されます。
30分の収録で約2~4分、1時間なら5~8分程度かかります。
複数話者の場合は、インポート時に人数を指定すると精度が上がります。
文字編集でカットする方法
これが Descript 最大の特徴です。
文字原稿を読み、不要な部分を選択して削除するだけで、対応する音声・動画が消去されます。
- 単語単位で精密にカット可能
- 文字を修正するだけで字幕も自動更新
- Cmd+Z で簡単に元に戻せる
- 無音時間を自動削除するオプションも便利
フィラーワード自動削除
「Actions → Remove Filler Words」で、えーと・あのー・like などを自動検出して削除できます。
精度は約85~90%。削除前に一覧を確認し、必要なものは残せます。
自動でクロスフェードが入るため、不自然な音の飛びが発生しません。
Overdub:AI音声クローン
自分の声を10分程度録音すると、AIがその声を学習。
後から文字を打ち込むだけで、自分の声で音声を追加・修正できます。
✅ 日付や数字の間違いを撮り直し不要で修正
✅ 短いフレーズなら非常に自然
✅ 長文の生成より「部分修正」に最適
✅ 短いフレーズなら非常に自然
✅ 長文の生成より「部分修正」に最適
利用には Creator または Pro プランが必要です。
画面録画機能
File → New Screen Recording で、画面・ウェブカメラ・マイクを同時収録可能。
録画後すぐに、同じように文字編集でカットできます。
- カーソルハイライト表示
- ズームエフェクト自動追加
- ウェブカメラ背景ぼかし
ソフトチュートリアル・操作説明動画に最適です。
動画編集機能
音声だけでなく、動画編集も一括で行えます。
B-roll 挿入・テロップ・BGM 追加・文字カット連動など、基本的な編集は網羅しています。
複数トラックの編集にも対応。
インタビュアーとゲストの音声を別トラックで編集すると、さらにスムーズになります。
その他のAI機能
DescriptはAI機能を急速に追加しています。
- AIショーノート生成:概要・チャプターを自動作成
- 視線補正:カメラ目線に補正
- Studio Sound:ノイズ除去・音質改善
- テレプロンプター:台本を見ながら収録可能
書き出し・公開方法
編集が終わったら、各種形式で書き出しできます。
- 音声:MP3 / WAV(ポッドキャストは192kbps MP3推奨)
- 動画:MP4(YouTube向け高品質~Web向け軽量)
- 文字原稿:Word / SRT字幕 / プレーンテキスト
- 直接投稿:YouTube・ポッドキャストホストへ直接出力
料金プラン
無料プランはお試しに十分ですが、本格利用には有料プランが必要です。
Free
月1時間文字起こし / 無料Creator $24/月
月10時間文字起こし / Overdub / 画面録画Pro $40/月
文字起こし無制限 / チーム機能得意・不得意な用途
得意な用途
- ポッドキャスト編集
- YouTube 解説動画
- 研修動画・オンライン講座
- Zoom録画の編集
- インタビュー文字起こし
不得意な用途
- 2時間以上の長尺編集(動作が重くなる)
- 複雑な視覚エフェクト
- オフラインでの利用(クラウド依存)
- 日本語以外の特殊アクセントでのOverdub
よくある質問(FAQ)
Descriptは無料で使えますか?
はい、無料プランで月1時間の文字起こしと基本機能が利用可能です。本格的に使うならCreatorプランが推奨です。
動画も編集できますか?
はい。音声と同じく文字編集でカットでき、B-rollや字幕追加も可能です。
文字起こしの精度はどれくらい?
クリアな音声で90%以上の精度です。専門用語は自動修正が必要な場合があります。
Overdubは自然な声になりますか?
単語や短いフレーズの修正なら非常に自然です。長文を生成するとやや機械的になります。
MacとWindowsの両方で使えますか?
はい、どちらにも対応しています。Linux版はありません。
