https://voicevox.hiroshiba.jp/
GUIの使い方は見ればわかると思うので、ここでは REST API を利用する方法を記載します。
Linux CPU tar.gzhttps://voicevox.hiroshiba.jp/
tar zxvf voicevox-linux-cpu-x.xx.x.tar.gz
cd VOICEVOX/vv-engine ./run --host 0.0.0.0 --port 50021http://0.0.0.0:50021 で待ち受けます。
version: '3'
services:
voicevox:
image: voicevox/voicevox_engine:nvidia-latest
ports:
- 127.0.0.1:50021:50021
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: 1
capabilities: [gpu]
# 外部からアクセス可能とする場合は、127.0.0.1 → 0.0.0.0 に変更ください。
起動する。
docker-compose up -d
※コンテナで GPU を使う方法は、Windows/wsl/gpu を参照ください。
curl http://127.0.0.1:50021/speakers
# path: audio_query # query: # text=<メッセージ> # speaker=<キャラID> # 出力: 音声合成で利用する JSON データが返されます。 curl -X POST -G http://127.0.0.1:50021/audio_query --data-urlencode 'text=今日の天気は晴れでしょう' --data-urlencode 'speaker=1'
# 音声合成用のクエリ作成の応答を取得
RESPONSE=`curl -X POST -G http://127.0.0.1:50021/audio_query --data-urlencode 'text=今日の天気は晴れでしょう' --data-urlencode 'speaker=1'`
# 音声合成
# path: synthesis
# query:
# speaker=<キャラID>
# body:
# <音声合成用のクエリ作成の応答(JSON)>
# 出力: 音声合成した wav ファイルが返されます。
curl -X POST -H "Content-Type: application/json" http://127.0.0.1:50021/synthesis?speaker=1 -d "${RESPONSE}" --output "output.wav"1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 | - ! - ! - | ! - ! - | ! - ! | |
https://voicevox.github.io/voicevox_engine/api/ または、起動後 http://127.0.0.1:50021/docs にアクセスすることで API が確認できます。