概要 Unreal Speech
Unreal Speech レビュー 2026|高速・低価格なAI音声合成API
Unreal Speech の重要ポイント
- Eleven Labsと比較して11倍安いコスパ抜群のText‑to‑Speech API
- 300msで音声ストリーミングを開始、超低遅延を実現
- 1回のリクエストで最長10時間の音声生成に対応
- 単語ごとのタイムスタンプを標準で提供、字幕同期に最適
- 8言語・48種類の自然なAI音声を搭載
- 月額0円から始められ、利用量が多いほど1文字あたりの単価が安くなる
Unreal Speech とは
Unreal Speechは、コストパフォーマンスと速度を重視したクラウド型AI音声合成APIです。動画ナレーション、オーディオブック、アプリ内読み上げ、リアルタイムボイスチャットなど、幅広い用途に対応しています。
高品質な音声を保ちながら、大手サービスと比較して大幅に低価格な料金体系を実現し、大規模な文字数を処理する企業や開発者から支持されています。
主な機能と特徴
・超低遅延ストリーミング:300msで音声出力開始
・長文対応:1回のリクエストで最長10時間の音声を生成
・単語単位・文単位のタイムスタンプに対応
・WebSocketによるリアルタイム音声+タイムスタンプ同時配信
・8言語・48種類の自然なAI音声を提供
・速度、ピッチ、ビットレートを細かく調整可能
・99.9%の稼働率を確保、大量リクエストに安定対応
・Python、Node.js、React Native、curlなど各言語のサンプルコードを完備
音声品質スコア
| カテゴリ | スコア |
|---|---|
| フィクション | 4.72 |
| ノンフィクション | 4.37 |
| 会話 | 3.91 |
料金プラン(公式正確)
| プラン | 月額料金 | 月間文字数 | 追加料金 |
|---|---|---|---|
| Free | 0円 | 250,000文字 | - |
| Basic | 49ドル | 300万文字 | 16ドル/100万文字 |
| Plus | 499ドル | 6200万文字 | 12ドル/100万文字 |
| Pro | 1499ドル | 1億5000万文字 | 10ドル/100万文字 |
| Enterprise | 4999ドル | 6億2500万文字 | 8ドル/100万文字 |
無料プランは商用利用時にクレジットが必要。有料プランはクレジット不要、未使用文字数は翌月に繰り越し。
APIエンドポイント一覧
/stream:最大1000文字、同期・0.3秒遅延、ストリーミング
/speech:最大3000文字、同期、MP3+タイムスタンプURL返却
/synthesisTasks:最大50万文字、非同期、タスクIDで取得
/streamWithTimestamps:WebSocket、音声+単語タイムスタンプ同時配信
サンプルコード(Python)
# /stream 短いテキスト(1000文字以内)
import requests
response = requests.post(
"https://api.v8.unrealspeech.com/stream",
headers={"Authorization": "Bearer YOUR_API_KEY"},
json={
"Text": "こんにちは、Unreal Speechです。",
"VoiceId": "Scarlett",
"Bitrate": "192k",
"Speed": 0,
"Pitch": 1,
"Codec": "libmp3lame"
}
)
with open("audio.mp3", "wb") as f:
f.write(response.content)
# /speech 中程度のテキスト(3000文字以内)
import requests
response = requests.post(
"https://api.v8.unrealspeech.com/speech",
headers={"Authorization": "Bearer YOUR_API_KEY"},
json={
"Text": "長めのテキストをここに入力",
"VoiceId": "Dan",
"Bitrate": "192k",
"Speed": 0,
"Pitch": 1,
"TimestampType": "word"
}
)
print(response.json())
# /synthesisTasks 長文(50万文字以内)
import requests
response = requests.post(
"https://api.v8.unrealspeech.com/synthesisTasks",
headers={"Authorization": "Bearer YOUR_API_KEY"},
json={
"Text": "長時間コンテンツのテキスト",
"VoiceId": "Liv",
"Bitrate": "192k",
"Speed": 0,
"Pitch": 1,
"TimestampType": "sentence"
}
)
print(response.json())
対応言語
アメリカ英語、イギリス英語、中国語、ヒンディー語、スペイン語、ポルトガル語、日本語、フランス語、イタリア語
よくある質問
- ボイスクローンに対応していますか
- 現在は対応していませんが、開発中です。
- 生成した音声を商用利用できますか
- はい、利用可能です。無料プランはクレジットが必要です。
- 未使用の文字数は繰り越されますか
- 有料プランは繰り越されます。無料プランは月初にリセットされます。
- どのような音声形式に対応していますか
- MP3、PCM、μ-lawなどに対応。ビットレートは16k~320kまで選択可能です。
