Compare commits

...

66 Commits

Author SHA1 Message Date
github-actions[bot]
d9d890975a
@mallocfree009 has signed the CLA from Pull Request #1504 2025-05-17 10:32:01 +00:00
wok
8043fce1ce READMEファイルを更新し、v.2.0.78-betaの新機能とバグ修正を追加しました。 2025-05-16 01:33:01 +09:00
wok
3677f6e268 RTX 5090に関する新機能を追加し、各言語のREADMEファイルを更新しました。 2025-05-03 04:06:57 +09:00
wok
0318700981 update 2025-02-16 01:26:08 +09:00
wok
66cbbeed1a update 2024-11-15 04:10:35 +09:00
wok
b262d28c10 update 2024-11-13 02:01:48 +09:00
wok
38a9164e5c update 2024-11-08 23:26:14 +09:00
wok
e472934bb4 update 2024-11-08 12:34:18 +09:00
wok
6129780229 fix typo 2024-10-08 20:10:41 +09:00
wok
e821960c59 Merge branch 'master' of github.com:w-okada/voice-changer 2024-10-08 14:54:33 +09:00
wok
fa77d69bed update 2024-10-08 14:54:30 +09:00
w-okada
7ab6a63a67
Merge pull request #1347 from QweRezOn/master
Add Russian Readme File
2024-09-15 08:01:23 +09:00
github-actions[bot]
763a6a0763
@QweRezOn has signed the CLA from Pull Request #1347 2024-09-13 17:04:56 +00:00
QweRez
dfbc95bd61
Update README_ru.md 2024-09-13 20:03:50 +03:00
QweRez
33387bd351
Update README.md 2024-09-13 20:02:44 +03:00
QweRez
b02c4f48c3
Create README_dev_ru.md 2024-09-13 20:02:19 +03:00
QweRez
006b9d575c
Update README_dev_en.md 2024-09-13 19:59:08 +03:00
QweRez
4ebcd670e7
Update README_en.md 2024-09-13 19:57:30 +03:00
QweRez
0b5daf162b
Create README_ru.md
add ru
2024-09-13 19:56:56 +03:00
wok
11b5deecb8 update 2024-08-27 09:29:07 +09:00
wok
fd849db239 update 2024-08-21 10:29:31 +09:00
wok
6d9e735883 update 2024-08-18 23:13:17 +09:00
wok
b5d3e5f066 update 2024-08-07 19:51:20 +09:00
wok
a75f87e433 update 2024-08-06 23:47:11 +09:00
wok
285615d67c update 2024-08-01 11:01:20 +09:00
wok
eef8395205 update 2024-07-27 18:14:50 +09:00
wok
465ab1ff23 update 2024-07-21 02:29:03 +09:00
wok
1f51581ae3 update 2024-07-20 05:37:14 +09:00
wok
87b547e724 update 2024-07-20 02:32:21 +09:00
wok
3b83221cec update 2024-07-20 02:30:06 +09:00
wok
f79855f8b2 update 2024-07-10 23:54:40 +09:00
wok
1952c76533 update 2024-06-30 17:07:52 +09:00
wok
92f0b1aaf5 update 2024-06-30 16:17:10 +09:00
wok
ebea9d2692 update 2024-06-29 07:07:58 +09:00
wok
a91ef76b64 update 2024-06-29 07:06:55 +09:00
wok
0cd7f69931 update 2024-06-29 07:05:57 +09:00
wok
b350812083 update 2024-06-29 07:05:30 +09:00
wok
80ccc0b1d7 update 2024-06-29 07:03:40 +09:00
wok
cc60c7adfb update 2024-06-29 07:03:11 +09:00
wok
d61f6b8e99 update 2024-06-29 07:02:35 +09:00
wok
7adc1f1cf5 update 2024-06-29 07:02:04 +09:00
wok
7e177ee84c update 2024-06-29 07:01:26 +09:00
wok
51046638d6 update 2024-06-29 07:00:57 +09:00
wok
2522d44f13 update 2024-06-29 07:00:30 +09:00
wok
018cab3ded update 2024-06-29 07:00:01 +09:00
wok
a1714878a7 update 2024-06-29 06:59:34 +09:00
wok
23b69ba121 update 2024-06-29 06:56:19 +09:00
wok
9f6903e4e9 update 2024-06-29 06:48:05 +09:00
wok
4c59ab5431 update 2024-06-24 03:49:37 +09:00
wok
33d74e8e73 Merge branch 'master' of github.com:w-okada/voice-changer 2024-06-24 03:47:52 +09:00
wok
5f1ca7af51 update 2024-06-24 03:47:25 +09:00
github-actions[bot]
56a5094881
@Nick088Official has signed the CLA from Pull Request #1241 2024-06-15 16:27:47 +00:00
wok
cde810a9d0 add cuda question 2024-06-12 05:01:52 +09:00
wok
73bb47f745 update 2024-06-10 20:09:30 +09:00
wok
349d268189 update 2024-06-05 18:39:35 +09:00
wok
3a8cbb07de update 2024-06-03 20:57:28 +09:00
github-actions[bot]
800285f2cd
@vitaliylag has signed the CLA from Pull Request #1224 2024-06-01 03:14:09 +00:00
github-actions[bot]
d3add2561d
@mrs1669 has signed the CLA from Pull Request #1171 2024-04-04 10:53:26 +00:00
w-okada
621ad25a8a
Merge pull request #1153 from deiteris/harden-security
Harden web server security
2024-04-02 16:04:02 +09:00
Yury
8dd8d7127d Refactor and add origin check to SIO 2024-03-18 22:52:46 +02:00
Yury
ce9b599501 Improve allowed origins input and use set 2024-03-17 16:26:55 +02:00
github-actions[bot]
28fc541891
@deiteris has signed the CLA from Pull Request #1153 2024-03-16 22:24:48 +00:00
Yury
cf2b693334 Harden web server security 2024-03-17 00:11:16 +02:00
w-okada
11672e9653 Merge branch 'master' of github.com:w-okada/voice-changer 2024-03-05 23:47:48 +09:00
w-okada
aa620e1cf0
Merge pull request #1141 from richardhbtz/patch-1
Misspelling "trouble"
2024-03-04 10:35:17 +09:00
Richard Habitzreuter
0e2078a268
Misspelling "trouble" 2024-02-29 16:58:06 -03:00
28 changed files with 2584 additions and 361 deletions

View File

@ -1,4 +1,4 @@
name: Issue or Bug Report name: Issue or Bug Report for v.1.x.x.x
description: Please provide as much detail as possible to convey the history of your problem. description: Please provide as much detail as possible to convey the history of your problem.
title: "[ISSUE]: " title: "[ISSUE]: "
body: body:

View File

@ -0,0 +1,82 @@
name: Issue or Bug Report for v.2.x.x
description: Please provide as much detail as possible to convey the history of your problem.
title: "[ISSUE for v2]: "
body:
- type: markdown
attributes:
value: Please read our [FAQ](https://github.com/w-okada/voice-changer/blob/master/.github/FAQ.md) before making a bug report!
- type: input
id: vc-client-version
attributes:
label: Voice Changer Version
description: Downloaded File Name (.zip)
placeholder: vcclient_win_std_x.y.x.zip, vcclient_win_cuda_torch_cuda_x.y.x.zip, or so
validations:
required: true
- type: input
id: OS
attributes:
label: Operational System
description: e.g. Windows 10, Ubuntu 20.04, MacOS Venture, MacOS Monterey, etc...
placeholder: Windows 10
validations:
required: true
- type: input
id: GPU
attributes:
label: GPU
description: If you have no gpu, please input none.
validations:
required: true
- type: input
id: CUDA
attributes:
label: CUDA Version
description: If you have nvidia gpu, please input version of cuda. Otherwise, please input none.
validations:
required: true
- type: checkboxes
id: checks
attributes:
label: Read carefully and check the options
options:
- label: If you use win_cuda_torch_cuda edition, setup cuda? [see here](https://onnxruntime.ai/docs/execution-providers/CUDA-ExecutionProvider.html#requirements)
- label: If you use win_cuda edition, setup cuda and cudnn? [see here](https://onnxruntime.ai/docs/execution-providers/CUDA-ExecutionProvider.html#requirements)
- label: If you use mac edition, client is not launched automatically. Use chrome to open application.?
- label: I've tried to change the Chunk Size
- label: I've tried to set the Index to zero
- label: I've read the [tutorial](https://github.com/w-okada/voice-changer/blob/master/tutorials/tutorial_rvc_en_latest.md)
- label: I've tried to extract to another folder (or re-extract) the .zip file
- type: dropdown
id: sample-model-work
attributes:
label: Does pre-installed model work?
options:
- "No"
- "YES"
default: 0
- type: input
id: vc-type
attributes:
label: Model Type
description: MMVC, so-vits-rvc, RVC, DDSP-SVC
placeholder: RVC
validations:
required: true
- type: textarea
id: issue
attributes:
label: Issue Description
description: Please provide as much reproducible information and logs as possible
- type: textarea
id: capture
attributes:
label: Application Screenshot
description: Please provide a screenshot of your application so we can see your settings (you can paste or drag-n-drop)
- type: textarea
id: logs-on-terminal
attributes:
label: Logs on console
description: Copy and paste the log on your console here
validations:
required: true

246
README.md
View File

@ -1,169 +1,110 @@
## VC Client [日本語](/README.md) /
[英語](/docs_i18n/README_en.md) /
[韓国語](/docs_i18n/README_ko.md)/
[中国語](/docs_i18n/README_zh.md)/
[ドイツ語](/docs_i18n/README_de.md)/
[アラビア語](/docs_i18n/README_ar.md)/
[ギリシャ語](/docs_i18n/README_el.md)/
[スペイン語](/docs_i18n/README_es.md)/
[フランス語](/docs_i18n/README_fr.md)/
[イタリア語](/docs_i18n/README_it.md)/
[ラテン語](/docs_i18n/README_la.md)/
[マレー語](/docs_i18n/README_ms.md)/
[ロシア語](/docs_i18n/README_ru.md)
*日本語以外は機械翻訳です。
[English](/README_en.md) [Korean](/README_ko.md) ## VCClient
VCClientは、AIを用いてリアルタイム音声変換を行うソフトウェアです。
## What's New! ## What's New!
- v.1.5.3.18a * v.2.0.78-beta
- Bugfix: FCPE * bugfix: RVCモデルのアップロードエラーを回避
* ver.1.x との同時起動ができるようになりました。
* 選択できるchunk sizeを増やしました。
- v.1.5.3.18 (removed.) * v.2.0.77-beta (only for RTX 5090, experimental)
- New Feature: FCPE * 関連モジュールを5090対応 (開発者がRTX5090未所持のため、動作未検証)
- Easy-VC (experimental) * v.2.0.76-beta
- v.1.5.3.17b * new feature:
- bugfix: * Beatrice: 話者マージの実装
- clear setting * Beatrice: オートピッチシフト
- improve * bugfix:
- file sanitizer * サーバモードのデバイス選択時の不具合対応
- chage: * v.2.0.73-beta
- default input chunk size: 192. * new feature:
- decided by this chart.(https://rentry.co/VoiceChangerGuide#gpu-chart-for-known-working-chunkextra) * 編集したbeatrice modelのダウンロード
* bugfix:
* beatrice v2 のpitch, formantが反映されないバグを修正
* Applio のembedderを使用しているモデルのONNXができないバグを修正
- v.1.5.3.17a ## ダウンロードと関連リンク
- Bug Fixes:
- Server mode error
- RVC Model merger
- Misc
- Add RVC Sample Chihaya-Jinja (https://chihaya369.booth.pm/items/4701666)
- v.1.5.3.17 Windows版、 M1 Mac版はhugging faceのリポジトリからダウンロードできます。
- New Features:
- Added similarity graph for Beatrice speaker selection
- Bug Fixes:
- Fixed crossfade issue with Beatrice speaker
- v.1.5.3.16a * [VCClient のリポジトリ](https://huggingface.co/wok000/vcclient000/tree/main)
- Bug fix: * [Light VCClient for Beatrice v2 のリポジトリ](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
- Lazy load Beatrice.
- v.1.5.3.16 (Only for Windows, CPU dependent) *1 Linuxはリポジトリをcloneしてお使いください。
- New Feature:
- Beatrice is supported(experimental)
- v.1.5.3.15 ### 関連リンク
- Improve:
- new rmvpe checkpoint for rvc (torch, onnx)
- Mac: upgrade torch version 2.1.0
* [Beatrice V2 トレーニングコードのリポジトリ](https://huggingface.co/fierce-cats/beatrice-trainer)
* [Beatrice V2 トレーニングコード Colab版](https://github.com/w-okada/beatrice-trainer-colab)
### 関連ソフトウェア
* [リアルタイムボイスチェンジャ VCClient](https://github.com/w-okada/voice-changer)
* [読み上げソフトウェア TTSClient](https://github.com/w-okada/ttsclient)
* [リアルタイム音声認識ソフトウェア ASRClient](https://github.com/w-okada/asrclient)
# VC Client とは ## VC Clientの特徴
1. 各種音声変換 AI(VC, Voice Conversion)を用いてリアルタイム音声変換を行うためのクライアントソフトウェアです。サポートしている音声変換 AI は次のものになります。 ## 多様なAIモデルをサポート
- サポートする音声変換 AI (サポート VC | AIモデル | v.2 | v.1 | ライセンス |
- [MMVC](https://github.com/isletennos/MMVC_Trainer) | ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
- [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | supported | supported | リポジトリを参照してください。 |
- [RVC(Retrieval-based-Voice-Conversion)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI) | [Beatrice v1](https://prj-beatrice.com/) | n/a | supported (only win) | [独自](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
- [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | [Beatrice v2](https://prj-beatrice.com/) | supported | n/a | [独自](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
- [Beatrice JVS Corpus Edition](https://prj-beatrice.com/) * experimental, (***NOT MIT Licnsence*** see [readme](https://github.com/w-okada/voice-changer/blob/master/server/voice_changer/Beatrice/)) * Only for Windows, CPU dependent | [MMVC](https://github.com/isletennos/MMVC_Trainer) | n/a | supported | リポジトリを参照してください。 |
1. 本ソフトウェアは、ネットワークを介した利用も可能であり、ゲームなどの高負荷なアプリケーションと同時に使用する場合などに音声変換処理の負荷を外部にオフロードすることができます。 | [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | n/a | supported | リポジトリを参照してください。 |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | n/a | supported | リポジトリを参照してください。 |
## スタンドアロン、ネットワーク経由の両構成をサポート
ローカルPCで完結した音声変換も、ネットワークを介した音声変換もサポートしています。
ネットワークを介した利用を行うことで、ゲームなどの高負荷なアプリケーションと同時に使用する場合に音声変換の負荷を外部にオフロードすることができます。
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png) ![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
3. 複数のプラットフォームに対応しています。 ## 複数プラットフォームに対応
- Windows, Mac(M1), Linux, Google Colab (MMVC のみ) Windows, Mac(M1), Linux, Google Colab
# 使用方法 *1 Linuxはリポジトリをcloneしてお使いください。
大きく 2 つの方法でご利用できます。難易度順に次の通りです。 ## REST APIを提供
- 事前ビルド済みの Binary での利用 各種プログラミング言語でクライアントを作成することができます。
- Docker や Anaconda など環境構築を行った上での利用
本ソフトウェアや MMVC になじみの薄い方は上から徐々に慣れていくとよいと思います。 また、curlなどのOSに組み込まれているHTTPクライアントを使って操作ができます。
## (1) 事前ビルド済みの Binary での利用 ## トラブルシュート
- 実行形式のバイナリをダウンロードして実行することができます。 [通信編](tutorials/trouble_shoot_communication_ja.md)
- チュートリアルは[こちら](tutorials/tutorial_rvc_ja_latest.md)をご覧ください。([ネットワークのトラブルシュート](https://github.com/w-okada/voice-changer/blob/master/tutorials/trouble_shoot_communication_ja.md)) ## 開発者の署名について
- [Google Colaboratory](https://github.com/w-okada/voice-changer/blob/master/Realtime_Voice_Changer_on_Colab.ipynb) で簡単にお試しいただけるようになりました。左上の Open in Colab のボタンから起動できます。
<img src="https://github.com/w-okada/voice-changer/assets/48346627/3f092e2d-6834-42f6-bbfd-7d389111604e" width="400" height="150">
- Windows 版と Mac 版を提供しています。
- Windows かつ Nvidia の GPU をご使用の方は、ONNX(cpu,cuda), PyTorch(cpu,cuda)をダウンロードしてください。
- Windows かつ AMD/Intel の GPU をご使用の方は、ONNX(cpu,DirectML), PyTorch(cpu,cuda)をダウンロードしてください。AMD/Intel の GPU は onnx のモデルを使用する場合のみ有効になります。
- いずれの GPU のサポート状況についても、PyTorch、Onnxruntime がサポートしている場合のみ有効になります。
- Windows で GPU をご使用にならない方は、ONNX(cpu,cuda), PyTorch(cpu,cuda)をダウンロードしてください。
- Windows 版は、ダウンロードした zip ファイルを解凍して、`start_http.bat`を実行してください。
- Mac 版はダウンロードファイルを解凍したのちに、`startHttp.command`を実行してください。開発元を検証できない旨が示される場合は、再度コントロールキーを押してクリックして実行してください(or 右クリックから実行してください)。
- 初回起動時は各種データをダウンロードします。ダウンロードに時間がかかる可能性があります。ダウンロードが完了すると、ブラウザが立ち上がります。
- リモートから接続する場合は、`.bat`ファイル(win)、`.command`ファイル(mac)の http が https に置き換わっているものを使用してください。
- DDPS-SVC の encoder は hubert-soft のみ対応です。
- ダウンロードはこちらから。
| Version | OS | フレームワーク | link | サポート VC | サイズ |
| ----------- | --- | ------------------------------------- | ------------------------------------------------------------------- | ----------------------------------------------------------------------------------- | ------ |
| v.1.5.3.18a | mac | ONNX(cpu), PyTorch(cpu,mps) | N/A | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3240MB |
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3125MB |
| v.1.5.3.17b | mac | ONNX(cpu), PyTorch(cpu,mps) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3240MB |
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3125MB |
| v.1.5.3.16a | mac | ONNX(cpu), PyTorch(cpu,mps) | N/A | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3240MB |
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3125MB |
| v.1.5.3.15 | mac | ONNX(cpu), PyTorch(cpu,mps) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC | 3240MB |
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC | 3125MB |
(\*1) Google Drive からダウンロードできない方は[hugging_face](https://huggingface.co/wok000/vcclient000/tree/main)からダウンロードしてみてください
(\*2) 開発者が AMD のグラフィックボードを持っていないので動作確認していません。onnxruntime-directml を同梱しただけのものです。
(\*3) 解凍や起動が遅い場合、ウィルス対策ソフトのチェックが走っている可能性があります。ファイルやフォルダを対象外にして実行してみてください。(自己責任です)
https://huggingface.co/wok000/vcclient000/resolve/main/MMVCServerSIO_win_onnxgpu-cuda_v.1.5.3.18.zip?download=true
## (2) Docker や Anaconda など環境構築を行った上での利用
本リポジトリをクローンして利用します。Windows では WSL2 の環境構築が必須になります。また、WSL2 上で Docker もしくは Anaconda などの仮想環境の構築が必要となります。Mac では Anaconda などの Python の仮想環境の構築が必要となります。事前準備が必要となりますが、多くの環境においてこの方法が一番高速で動きます。**<font color="red"> GPU が無くてもそこそこ新しい CPU であれば十分動く可能性があります </font>(下記のリアルタイム性の節を参照)**。
[WSL2 と Docker のインストールの解説動画](https://youtu.be/POo_Cg0eFMU)
[WSL2 と Anaconda のインストールの解説動画](https://youtu.be/fba9Zhsukqw)
Docker での実行は、[Docker を使用する](docker_vcclient/README.md)を参考にサーバを起動してください。
Anaconda の仮想環境上での実行は、[サーバ開発者向けのページ](README_dev_ja.md)を参考にサーバを起動してください。
# トラブルシュート
- [通信編](tutorials/trouble_shoot_communication_ja.md)
# リアルタイム性MMVC
GPU を使用するとほとんどタイムラグなく変換可能です。
https://twitter.com/DannadoriYellow/status/1613483372579545088?s=20&t=7CLD79h1F3dfKiTb7M8RUQ
CPU でも最近のであればそれなりの速度で変換可能。
https://twitter.com/DannadoriYellow/status/1613553862773997569?s=20&t=7CLD79h1F3dfKiTb7M8RUQ
古い CPU( i7-4770)だと、1000msec くらいかかってしまう。
# 開発者の署名について
本ソフトウェアは開発元の署名しておりません。下記のように警告が出ますが、コントロールキーを押しながらアイコンをクリックすると実行できるようになります。これは Apple のセキュリティポリシーによるものです。実行は自己責任となります。 本ソフトウェアは開発元の署名しておりません。下記のように警告が出ますが、コントロールキーを押しながらアイコンをクリックすると実行できるようになります。これは Apple のセキュリティポリシーによるものです。実行は自己責任となります。
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png) ![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
# Acknowledgments ## Acknowledgments
- [立ちずんだもん素材](https://seiga.nicovideo.jp/seiga/im10792934) * [立ちずんだもん素材](https://seiga.nicovideo.jp/seiga/im10792934)
- [いらすとや](https://www.irasutoya.com/) * [いらすとや](https://www.irasutoya.com/)
- [つくよみちゃん](https://tyc.rei-yumesaki.net/) * [つくよみちゃん](https://tyc.rei-yumesaki.net/)
``` ```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。 本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
@ -172,12 +113,12 @@ https://twitter.com/DannadoriYellow/status/1613553862773997569?s=20&t=7CLD79h1F3
© Rei Yumesaki © Rei Yumesaki
``` ```
- [あみたろの声素材工房](https://amitaro.net/) * [あみたろの声素材工房](https://amitaro.net/)
- [れぷりかどーる](https://kikyohiroto1227.wixsite.com/kikoto-utau) * [れぷりかどーる](https://kikyohiroto1227.wixsite.com/kikoto-utau)
# 利用規約 ## 利用規約
- リアルタイムボイスチェンジャーつくよみちゃんについては、つくよみちゃんコーパスの利用規約に準じ、次の目的で変換後の音声を使用することを禁止します。 * リアルタイムボイスチェンジャーつくよみちゃんについては、つくよみちゃんコーパスの利用規約に準じ、次の目的で変換後の音声を使用することを禁止します。
``` ```
@ -191,7 +132,7 @@ https://twitter.com/DannadoriYellow/status/1613553862773997569?s=20&t=7CLD79h1F3
※鑑賞用の作品として配布・販売していただくことは問題ございません。 ※鑑賞用の作品として配布・販売していただくことは問題ございません。
``` ```
- リアルタイムボイスチェンジャーあみたろについては、あみたろの声素材工房様の次の利用規約に準じます。詳細は[こちら](https://amitaro.net/voice/faq/#index_id6)です。 * リアルタイムボイスチェンジャーあみたろについては、あみたろの声素材工房様の次の利用規約に準じます。詳細は[こちら](https://amitaro.net/voice/faq/#index_id6)
``` ```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。 あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
@ -200,31 +141,8 @@ https://twitter.com/DannadoriYellow/status/1613553862773997569?s=20&t=7CLD79h1F3
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。 また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
``` ```
- リアルタイムボイスチェンジャー黄琴まひろについては、れぷりかどーるの利用規約に準じます。詳細は[こちら](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)です。 * リアルタイムボイスチェンジャー黄琴まひろについては、れぷりかどーるの利用規約に準じます。詳細は[こちら](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
# 免責事項 ## 免責事項
本ソフトウェアの使用または使用不能により生じたいかなる直接損害・間接損害・波及的損害・結果的損害 または特別損害についても、一切責任を負いません。 本ソフトウェアの使用または使用不能により生じたいかなる直接損害・間接損害・波及的損害・結果的損害 または特別損害についても、一切責任を負いません。
# (1) レコーダー(トレーニング用音声録音アプリ)
MMVC トレーニング用の音声を簡単に録音できるアプリです。
Github Pages 上で実行できるため、ブラウザのみあれば様々なプラットフォームからご利用可能です。
録音したデータは、ブラウザ上に保存されます。外部に漏れることはありません。
[録音アプリ on Github Pages](https://w-okada.github.io/voice-changer/)
[解説動画](https://youtu.be/s_GirFEGvaA)
# 過去バージョン
| Version | OS | フレームワーク | link | サポート VC | サイズ |
| ---------- | --- | --------------------------------- | ---------------------------------------------------------------------------------------------- | ----------------------------------------------------------------------------- | ------ |
| v.1.5.2.9e | mac | ONNX(cpu), PyTorch(cpu,mps) | [normal](https://drive.google.com/uc?id=1W0d7I7619PcO7kjb1SPXp6MmH5Unvd78&export=download) \*1 | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 796MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [normal](https://drive.google.com/uc?id=1tmTMJRRggS2Sb4goU-eHlRvUBR88RZDl&export=download) \*1 | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, so-vits-svc 4.0v2, RVC, DDSP-SVC | 2872MB |
| v.1.5.3.1 | mac | ONNX(cpu), PyTorch(cpu,mps) | [normal](https://drive.google.com/uc?id=1oswF72q_cQQeXhIn6W275qLnoBAmcrR_&export=download) \*1 | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 796MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [normal](https://drive.google.com/uc?id=1AWjDhW4w2Uljp1-9P8YUJBZsIlnhkJX2&export=download) \*1 | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, so-vits-svc 4.0v2, RVC, DDSP-SVC | 2872MB |
# For Contributor
このリポジトリは[CLA](https://raw.githubusercontent.com/w-okada/voice-changer/master/LICENSE-CLA)を設定しています。

View File

@ -1,6 +1,6 @@
## For Developper ## For Developper
[Japanese](/README_dev_ja.md) [Japanese](/README_dev_ja.md) [Russian](/README_dev_ru.md)
## Prerequisit ## Prerequisit

124
README_dev_ru.md Normal file
View File

@ -0,0 +1,124 @@
Вот перевод файла `README_dev_en.md` на русский язык:
## Для разработчиков
[Японский](/README_dev_ja.md) [Английский](/README_dev_en.md)
## Требования
- Linux (Ubuntu, Debian) или WSL2 (другие дистрибуции Linux и Mac не тестировались)
- Anaconda
## Подготовка
1. Создайте виртуальную среду Anaconda:
```
$ conda create -n vcclient-dev python=3.10
$ conda activate vcclient-dev
```
2. Клонируйте репозиторий:
```
$ git clone https://github.com/w-okada/voice-changer.git
```
## Для серверных разработчиков
1. Установите необходимые зависимости:
```
$ cd voice-changer/server
$ pip install -r requirements.txt
```
2. Запустите сервер
Запустите сервер с помощью следующей команды. Вы можете указать свои пути к весам моделей.
```
$ python3 MMVCServerSIO.py -p 18888 --https true \
--content_vec_500 pretrain/checkpoint_best_legacy_500.pt \
--content_vec_500_onnx pretrain/content_vec_500.onnx \
--content_vec_500_onnx_on true \
--hubert_base pretrain/hubert_base.pt \
--hubert_base_jp pretrain/rinna_hubert_base_jp.pt \
--hubert_soft pretrain/hubert/hubert-soft-0d54a1f4.pt \
--nsf_hifigan pretrain/nsf_hifigan/model \
--crepe_onnx_full pretrain/crepe_onnx_full.onnx \
--crepe_onnx_tiny pretrain/crepe_onnx_tiny.onnx \
--rmvpe pretrain/rmvpe.pt \
--model_dir model_dir \
--samples samples.json
```
Откройте браузер (на данный момент поддерживается только Chrome), и вы увидите графический интерфейс.
2-1. Устранение неполадок
(1) OSError: не найдена библиотека PortAudio
Если вы получите сообщение ниже, необходимо установить дополнительную библиотеку:
```
OSError: PortAudio library not found
```
Вы можете установить библиотеку командой:
```
$ sudo apt-get install libportaudio2
$ sudo apt-get install libasound-dev
```
(2) Не запускается! Чертова программа!
Клиент не запускается автоматически. Пожалуйста, откройте браузер и перейдите по URL, отображаемому в консоли. И будьте осторожны со словами.
(3) Не удалось загрузить библиотеку libcudnn_cnn_infer.so.8
При использовании WSL может возникнуть ошибка `Could not load library libcudnn_cnn_infer.so.8. Error: libcuda.so: cannot open shared object file: No such file or directory`. Это часто связано с тем, что путь к библиотеке не установлен. Установите путь с помощью команды ниже. Вы можете добавить эту команду в ваш скрипт запуска, например, в .bashrc.
```
export LD_LIBRARY_PATH=/usr/lib/wsl/lib:$LD_LIBRARY_PATH
```
- ссылки:
- https://qiita.com/cacaoMath/items/811146342946cdde5b83
- https://github.com/microsoft/WSL/issues/8587
3. Наслаждайтесь разработкой.
### Приложение
1. Windows + Anaconda (не поддерживается)
Используйте conda для установки PyTorch:
```
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
```
Также выполните эти команды:
```
pip install chardet
pip install numpy==1.24.0
```
## Для клиентских разработчиков
1. Импорт модулей и начальная сборка:
```
cd client
cd lib
npm install
npm run build:dev
cd ../demo
npm install
npm run build:dev
```
2. Наслаждайтесь.

View File

@ -1,60 +1,41 @@
## VC Client ## VC Client
[Japanese](/README_ja.md) [Korean](/README_ko.md) [Japanese](/README_ja.md) [Korean](/README_ko.md) [Russian](/README_ru.md)
## What's New! ## What's New!
- v.1.5.3.18a - We have released a sister product, the Text To Speech client.
- Bugfix: FCPE - You can enjoy voice generation with a simple interface.
- For more details, click [here](https://github.com/w-okada/ttsclient).
- v.1.5.3.18 (removed.) - Beatrice V2 Training Code Released!!!
- New Feature: FCPE - [Training Code Repository](https://huggingface.co/fierce-cats/beatrice-trainer)
- Easy-VC (experimental) - [Colab Version](https://github.com/w-okada/beatrice-trainer-colab)
- v.1.5.3.17b - v.2.0.70-beta (only for m1 mac)
- [HERE](https://github.com/w-okada/voice-changer/tree/v.2)
- new feature:
- The M1 Mac version of VCClient now supports Beatrice v2 beta.1.
- v.2.0.69-beta (only for win)
- [HERE](https://github.com/w-okada/voice-changer/tree/v.2)
- bugfix: - bugfix:
- clear setting - Fixed a bug where the start button would not be displayed in case of some exceptions
- improve - Adjusted the output buffer for server device mode
- file sanitizer - Fixed a bug where the sampling rate would change when settings were modified while using server device mode
- chage: - Fixed a bug when using Japanese hubert
- default input chunk size: 192. - misc:
- decided by this chart.(https://rentry.co/VoiceChangerGuide#gpu-chart-for-known-working-chunkextra) - Added host API filter (highlighted) for server device mode
- v.2.0.65-beta
- v.1.5.3.17a - [HERE](https://github.com/w-okada/voice-changer/tree/v.2)
- Bug Fixes: - new feature: We have supported Beatrice v2 beta.1, enabling even higher quality voice conversion.
- Server mode error
- RVC Model merger
- Misc
- Add RVC Sample Chihaya-Jinja (https://chihaya369.booth.pm/items/4701666)
- v.1.5.3.17
- New Features:
- Added similarity graph for Beatrice speaker selection
- Bug Fixes:
- Fixed crossfade issue with Beatrice speaker
- v.1.5.3.16a
- Bug fix:
- Lazy load Beatrice.
- v.1.5.3.16 (Only for Windows, CPU dependent)
- New Feature:
- Beatrice is supported(experimental)
- v.1.5.3.15
- Improve:
- new rmvpe checkpoint for rvc (torch, onnx)
- Mac: upgrade torch version 2.1.0
# What is VC Client # What is VC Client
1. This is a client software for performing real-time voice conversion using various Voice Conversion (VC) AI. The supported AI for voice conversion are as follows. 1. This is a client software for performing real-time voice conversion using various Voice Conversion (VC) AI. The supported AI for voice conversion are as follows.
- [MMVC](https://github.com/isletennos/MMVC_Trainer) - [MMVC](https://github.com/isletennos/MMVC_Trainer) (only v1)
- [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) - [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) (only v1)
- [RVC(Retrieval-based-Voice-Conversion)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI) - [RVC(Retrieval-based-Voice-Conversion)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI)
- [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) - [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) (only v1)
- [Beatrice JVS Corpus Edition](https://prj-beatrice.com/) * experimental, (***NOT MIT Licnsence*** see [readme](https://github.com/w-okada/voice-changer/blob/master/server/voice_changer/Beatrice/)) * Only for Windows, CPU dependent - [Beatrice JVS Corpus Edition](https://prj-beatrice.com/) * experimental, (***NOT MIT License*** see [readme](https://github.com/w-okada/voice-changer/blob/master/server/voice_changer/Beatrice/)) * Only for Windows, CPU dependent (only v1)
- [Beatrice v2](https://prj-beatrice.com/) (only for v2)
1. Distribute the load by running Voice Changer on a different PC 1. Distribute the load by running Voice Changer on a different PC
The real-time voice changer of this application works on a server-client configuration. By running the MMVC server on a separate PC, you can run it while minimizing the impact on other resource-intensive processes such as gaming commentary. The real-time voice changer of this application works on a server-client configuration. By running the MMVC server on a separate PC, you can run it while minimizing the impact on other resource-intensive processes such as gaming commentary.
@ -63,7 +44,10 @@
3. Cross-platform compatibility 3. Cross-platform compatibility
Supports Windows, Mac (including Apple Silicon M1), Linux, and Google Colaboratory. Supports Windows, Mac (including Apple Silicon M1), Linux, and Google Colaboratory.
## Related Software
- [Real-time Voice Changer VCClient](https://github.com/w-okada/voice-changer)
- [Text-to-Speech Software TTSClient](https://github.com/w-okada/ttsclient)
- [Real-Time Speech Recognition Software ASRClient](https://github.com/w-okada/asrclient)
# usage # usage
This is an app for performing voice changes with MMVC and so-vits-svc. This is an app for performing voice changes with MMVC and so-vits-svc.
@ -77,14 +61,19 @@ It can be used in two main ways, in order of difficulty:
- You can download and run executable binaries. - You can download and run executable binaries.
- Please see [here](tutorials/tutorial_rvc_en_latest.md) for the tutorial. ([troubule shoot](https://github.com/w-okada/voice-changer/blob/master/tutorials/trouble_shoot_communication_ja.md)) - Please see [here](tutorials/tutorial_rvc_en_latest.md) for the tutorial. ([trouble shoot](https://github.com/w-okada/voice-changer/blob/master/tutorials/trouble_shoot_communication_ja.md))
- It's now easy to try it out on [Google Colaboratory](https://github.com/w-okada/voice-changer/blob/master/Realtime_Voice_Changer_on_Colab.ipynb) (requires a ngrok account). You can launch it from the 'Open in Colab' button in the top left corner. - It's now easy to try it out on [Google Colaboratory](https://github.com/w-okada/voice-changer/tree/v.2/w_okada's_Voice_Changer_version_2_x.ipynb) (requires a ngrok account). You can launch it from the 'Open in Colab' button in the top left corner.
<img src="https://github.com/w-okada/voice-changer/assets/48346627/3f092e2d-6834-42f6-bbfd-7d389111604e" width="400" height="150"> <img src="https://github.com/w-okada/voice-changer/assets/48346627/3f092e2d-6834-42f6-bbfd-7d389111604e" width="400" height="150">
- We offer Windows and Mac versions. - We offer Windows and Mac versions on [hugging face](https://huggingface.co/wok000/vcclient000/tree/main)
- v2 for Windows
- Please download and use `vcclient_win_std_xxx.zip`. You can perform voice conversion using a reasonably high-performance CPU without a GPU, or by utilizing DirectML to leverage GPUs (AMD, Nvidia). v2 supports both torch and onnx.
- If you have an Nvidia GPU, you can achieve faster voice conversion by using `vcclient_win_cuda_xxx.zip`.
- v2 for Mac (Apple Silicon)
- Please download and use `vcclient_mac_xxx.zip`.
- v1
- If you are using a Windows and Nvidia GPU, please download ONNX (cpu, cuda), PyTorch (cpu, cuda). - If you are using a Windows and Nvidia GPU, please download ONNX (cpu, cuda), PyTorch (cpu, cuda).
- If you are using a Windows and AMD/Intel GPU, please download ONNX (cpu, DirectML) and PyTorch (cpu, cuda). AMD/Intel GPUs are only enabled for ONNX models. - If you are using a Windows and AMD/Intel GPU, please download ONNX (cpu, DirectML) and PyTorch (cpu, cuda). AMD/Intel GPUs are only enabled for ONNX models.
- In either case, for GPU support, PyTorch and Onnxruntime are only enabled if supported. - In either case, for GPU support, PyTorch and Onnxruntime are only enabled if supported.
@ -98,26 +87,7 @@ It can be used in two main ways, in order of difficulty:
- The encoder of DDPS-SVC only supports hubert-soft. - The encoder of DDPS-SVC only supports hubert-soft.
- Download (When you cannot download from google drive, try [hugging_face](https://huggingface.co/wok000/vcclient000/tree/main)) - [Download from hugging face](https://huggingface.co/wok000/vcclient000/tree/main)
| Version | OS | Framework | link | support VC | size |
| ----------- | --- | ------------------------------------- | ------------------------------------------------------------------- | ----------------------------------------------------------------------------------- | ------ |
| v.1.5.3.18a | mac | ONNX(cpu), PyTorch(cpu,mps) | N/A | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3240MB |
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3125MB |
| v.1.5.3.17b | mac | ONNX(cpu), PyTorch(cpu,mps) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3240MB |
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3125MB |
| v.1.5.3.16a | mac | ONNX(cpu), PyTorch(cpu,mps) | N/A | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3240MB |
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3125MB |
| v.1.5.3.15 | mac | ONNX(cpu), PyTorch(cpu,mps) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC | 3240MB |
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC | 3125MB |
(\*1) You can also download from [hugging_face](https://huggingface.co/wok000/vcclient000/tree/main)
(\*2) The developer does not have an AMD graphics card, so it has not been tested. This package only includes onnxruntime-directml.
(\*3) If unpacking or starting is slow, there is a possibility that virus checking is running on your antivirus software. Please try running it with the file or folder excluded from the target. (At your own risk)
## (2) Usage after setting up the environment such as Docker or Anaconda ## (2) Usage after setting up the environment such as Docker or Anaconda
@ -133,17 +103,6 @@ To run on Anaconda venv, see [server developer's guide](README_dev_en.md)
To run on Linux using an AMD GPU, see [setup guide linux](tutorials/tutorial_anaconda_amd_rocm.md) To run on Linux using an AMD GPU, see [setup guide linux](tutorials/tutorial_anaconda_amd_rocm.md)
# Real-time performance
Conversion is almost instantaneous when using GPU.
https://twitter.com/DannadoriYellow/status/1613483372579545088?s=20&t=7CLD79h1F3dfKiTb7M8RUQ
Even with CPU, recent ones can perform conversions at a reasonable speed.
https://twitter.com/DannadoriYellow/status/1613553862773997569?s=20&t=7CLD79h1F3dfKiTb7M8RUQ
With an old CPU (i7-4770), it takes about 1000 msec for conversion.
# Software Signing # Software Signing

View File

@ -3,61 +3,40 @@
[English](/README_en.md) [Korean](/README_ko.md) [English](/README_en.md) [Korean](/README_ko.md)
## 새로운 기능! ## 새로운 기능!
- v.1.5.3.18a - 자매품으로 텍스트 음성 변환 클라이언트를 출시하였습니다.
- Bugfix: FCPE - 간단한 인터페이스로 음성 생성을 즐길 수 있습니다.
- 자세한 내용은 [여기](https://github.com/w-okada/ttsclient)를 참조하세요.
- v.1.5.3.18 (removed.) - Beatrice V2 훈련 코드 공개!!!
- New Feature: FCPE - [훈련 코드 리포지토리](https://huggingface.co/fierce-cats/beatrice-trainer)
- Easy-VC (experimental) - [Colab 버전](https://github.com/w-okada/beatrice-trainer-colab)
- v.1.5.3.17b - v.2.0.70-beta (only for m1 mac)
- bugfix: - [여기를 참조하십시오](https://github.com/w-okada/voice-changer/tree/v.2)
- clear setting - new feature:
- improve - M1 Mac 버전 VCClient에서도 Beatrice v2 beta.1을 지원합니다.
- file sanitizer - v.2.0.69-beta (only for win)
- chage: - [여기를 참조하십시오](https://github.com/w-okada/voice-changer/tree/v.2)
- default input chunk size: 192. - 버그 수정:
- decided by this chart.(https://rentry.co/VoiceChangerGuide#gpu-chart-for-known-working-chunkextra) - 일부 예외 발생 시 시작 버튼이 표시되지 않는 버그를 수정
- 서버 디바이스 모드의 출력 버퍼 조정
- v.1.5.3.17a - 서버 디바이스 모드 사용 중 설정 변경 시 샘플링 레이트가 변하는 버그 수정
- Bug Fixes: - 일본어 hubert 사용 시 버그 수정
- Server mode error - 기타:
- RVC Model merger - 서버 디바이스 모드에 호스트 API 필터 추가 (강조 표시)
- Misc - v.2.0.65-beta
- Add RVC Sample Chihaya-Jinja (https://chihaya369.booth.pm/items/4701666) - [여기를 참조하십시오](https://github.com/w-okada/voice-changer/tree/v.2)
- new feature: Beatrice v2 beta.1를 지원하여 더 높은 품질의 음성 변환이 가능해졌습니다
- v.1.5.3.17
- New Features:
- Added similarity graph for Beatrice speaker selection
- Bug Fixes:
- Fixed crossfade issue with Beatrice speaker
- v.1.5.3.16a
- Bug fix:
- Lazy load Beatrice.
- v.1.5.3.16 (Only for Windows, CPU dependent)
- New Feature:
- Beatrice is supported(experimental)
- v.1.5.3.15
- Improve:
- new rmvpe checkpoint for rvc (torch, onnx)
- Mac: upgrade torch version 2.1.0
# VC Client란 # VC Client란
1. 각종 음성 변환 AI(VC, Voice Conversion)를 활용해 실시간 음성 변환을 하기 위한 클라이언트 소프트웨어입니다. 지원하는 음성 변환 AI는 다음과 같습니다. 1. 각종 음성 변환 AI(VC, Voice Conversion)를 활용해 실시간 음성 변환을 하기 위한 클라이언트 소프트웨어입니다. 지원하는 음성 변환 AI는 다음과 같습니다.
- 지원하는 음성 변환 AI (지원 VC) - 지원하는 음성 변환 AI (지원 VC)
- [MMVC](https://github.com/isletennos/MMVC_Trainer) - [MMVC](https://github.com/isletennos/MMVC_Trainer) (only v1)
- [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) - [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) (only v1)
- [RVC(Retrieval-based-Voice-Conversion)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI) - [RVC(Retrieval-based-Voice-Conversion)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI)
- [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) - [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) (only v1)
- [Beatrice JVS Corpus Edition](https://prj-beatrice.com/) * experimental, (***NOT MIT Licnsence*** see [readme](https://github.com/w-okada/voice-changer/blob/master/server/voice_changer/Beatrice/)) * Only for Windows, CPU dependent - [Beatrice JVS Corpus Edition](https://prj-beatrice.com/) * experimental, (***NOT MIT License*** see [readme](https://github.com/w-okada/voice-changer/blob/master/server/voice_changer/Beatrice/)) * Only for Windows, CPU dependent (only v1)
- [Beatrice v2](https://prj-beatrice.com/) (only for v2)
- -
1. 이 소프트웨어는 네트워크를 통한 사용도 가능하며, 게임 등 부하가 큰 애플리케이션과 동시에 사용할 경우 음성 변화 처리의 부하를 외부로 돌릴 수도 있습니다. 1. 이 소프트웨어는 네트워크를 통한 사용도 가능하며, 게임 등 부하가 큰 애플리케이션과 동시에 사용할 경우 음성 변화 처리의 부하를 외부로 돌릴 수도 있습니다.
@ -66,7 +45,10 @@
3. 여러 플랫폼을 지원합니다. 3. 여러 플랫폼을 지원합니다.
- Windows, Mac(M1), Linux, Google Colab (MMVC만 지원) - Windows, Mac(M1), Linux, Google Colab (MMVC만 지원)
## 관련 소프트웨어
- [실시간 음성 변조기 VCClient](https://github.com/w-okada/voice-changer)
- [텍스트 읽기 소프트웨어 TTSClient](https://github.com/w-okada/ttsclient)
- [실시간 음성 인식 소프트웨어 ASRClient](https://github.com/w-okada/asrclient)
# 사용 방법 # 사용 방법
크게 두 가지 방법으로 사용할 수 있습니다. 난이도 순서는 다음과 같습니다. 크게 두 가지 방법으로 사용할 수 있습니다. 난이도 순서는 다음과 같습니다.
@ -82,12 +64,17 @@
- 튜토리얼은 [이곳](tutorials/tutorial_rvc_ko_latest.md)을 확인하세요。([네트워크 문제 해결법](https://github.com/w-okada/voice-changer/blob/master/tutorials/trouble_shoot_communication_ko.md)) - 튜토리얼은 [이곳](tutorials/tutorial_rvc_ko_latest.md)을 확인하세요。([네트워크 문제 해결법](https://github.com/w-okada/voice-changer/blob/master/tutorials/trouble_shoot_communication_ko.md))
- [Google Colaboratory](https://github.com/w-okada/voice-changer/blob/master/Realtime_Voice_Changer_on_Colab.ipynb) で簡単にお試しいただけるようになりました。左上の Open in Colab のボタンから起動できます。 - [Google Colaboratory](https://github.com/w-okada/voice-changer/tree/v.2/w_okada's_Voice_Changer_version_2_x.ipynb) で簡単にお試しいただけるようになりました。左上の Open in Colab のボタンから起動できます。
<img src="https://github.com/w-okada/voice-changer/assets/48346627/3f092e2d-6834-42f6-bbfd-7d389111604e" width="400" height="150"> <img src="https://github.com/w-okada/voice-changer/assets/48346627/3f092e2d-6834-42f6-bbfd-7d389111604e" width="400" height="150">
- Windows 버전과 Mac 버전을 제공하고 있습니다. - Windows 버전과 Mac 버전을 제공하고 있습니다. [Hugging Face](https://huggingface.co/wok000/vcclient000/tree/main)에서 다운로드할 수 있습니다.
- Windows용 v2
- `vcclient_win_std_xxx.zip`를 다운로드하여 사용하세요. GPU를 사용하지 않고도 (어느 정도 고성능의) CPU를 사용한 음성 변환이나, DirectML을 사용해 GPU(AMD, Nvidia)를 활용한 음성 변환이 가능합니다. v2에서는 torch와 onnx 모두를 지원합니다.
- Nvidia GPU를 가지고 계신 분들은 `vcclient_win_cuda_xxx.zip`를 사용하시면 더 빠른 음성 변환이 가능합니다.
- Mac (Apple Silicon)용 v2
- `vcclient_mac_xxx.zip`를 다운로드하여 사용하세요.
- v1
- Windows와 NVIDIA GPU를 사용하는 분은 ONNX(cpu, cuda), PyTorch(cpu, cuda)를 다운로드하세요. - Windows와 NVIDIA GPU를 사용하는 분은 ONNX(cpu, cuda), PyTorch(cpu, cuda)를 다운로드하세요.
- Windows와 AMD/Intel GPU를 사용하는 분은 ONNX(cpu, DirectML), PyTorch(cpu, cuda)를 다운로드하세요 AMD/Intel GPU는 ONNX 모델을 사용할 때만 적용됩니다. - Windows와 AMD/Intel GPU를 사용하는 분은 ONNX(cpu, DirectML), PyTorch(cpu, cuda)를 다운로드하세요 AMD/Intel GPU는 ONNX 모델을 사용할 때만 적용됩니다.
- 그 외 GPU도 PyTorch, Onnxruntime가 지원할 경우에만 적용됩니다. - 그 외 GPU도 PyTorch, Onnxruntime가 지원할 경우에만 적용됩니다.
@ -103,26 +90,6 @@
- DDPS-SVC의 encoder는 hubert-soft만 지원합니다. - DDPS-SVC의 encoder는 hubert-soft만 지원합니다.
- 다운로드는 아래에서 하세요.
| Version | OS | 프레임워크 | 링크 | 지원 VC | 파일 크기 |
| ----------- | --- | ------------------------------------- | ------------------------------------------------------------------- | ----------------------------------------------------------------------------------- | --------- |
| v.1.5.3.18a | mac | ONNX(cpu), PyTorch(cpu,mps) | N/A | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3240MB |
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3125MB |
| v.1.5.3.17b | mac | ONNX(cpu), PyTorch(cpu,mps) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3240MB |
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3125MB |
| v.1.5.3.16a | mac | ONNX(cpu), PyTorch(cpu,mps) | N/A | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3240MB |
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC, Beatrice | 3125MB |
| v.1.5.3.15 | mac | ONNX(cpu), PyTorch(cpu,mps) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC | 797MB |
| | win | ONNX(cpu,cuda), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC | 3240MB |
| | win | ONNX(cpu,DirectML), PyTorch(cpu,cuda) | [hugging face](https://huggingface.co/wok000/vcclient000/tree/main) | MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC | 3125MB |
(\*1) Google Drive에서 다운로드가 안 되는 분은 [hugging_face](https://huggingface.co/wok000/vcclient000/tree/main)에서 시도해 보세요
(\*2) 개발자가 AMD 그래픽카드를 갖고 있지 않아서 작동 확인을 할 수 없습니다. onnxruntime-directml를 같이 첨부한 것이 전부입니다.
(\*3) 압축 해제나 실행 속도가 느릴 경우에는 바이러스 검사가 진행 중일 가능성이 있습니다. 파일과 폴더를 검사 대상 제외를 한 후에 시도해 보세요. (이에 개발자는 책임이 없음)
## (2) Docker나 Anaconda 등으로 구축된 개발 환경에서 사용 ## (2) Docker나 Anaconda 등으로 구축된 개발 환경에서 사용
@ -140,17 +107,6 @@ Anaconda 가상 환경에서 실행은 [서버 개발자용 문서](README_dev_k
- [통신편](tutorials/trouble_shoot_communication_ko.md) - [통신편](tutorials/trouble_shoot_communication_ko.md)
# 실시간성(MMVC)
GPU를 사용하면 시간 차가 거의 없이 변환할 수 있습니다.
https://twitter.com/DannadoriYellow/status/1613483372579545088?s=20&t=7CLD79h1F3dfKiTb7M8RUQ
CPU도 최근 제품이라면 어느 정도 빠르게 변환할 수 있습니다.
https://twitter.com/DannadoriYellow/status/1613553862773997569?s=20&t=7CLD79h1F3dfKiTb7M8RUQ
오래된 CPU(i7-4770)면, 1000msec 정도 걸립니다.
# 개발자 서명에 대하여 # 개발자 서명에 대하여

119
README_ru.md Normal file
View File

@ -0,0 +1,119 @@
[Японский](/README_ja.md) [Корейский](/README_ko.md) [Английский](/README_en.md)
## Что нового!
- Мы выпустили продукт-сестру - клиент Text To Speech.
- Вы можете насладиться генерацией голоса через простой интерфейс.
- Подробнее [здесь](https://github.com/w-okada/ttsclient).
- Код тренировки Beatrice V2 теперь доступен!
- [Репозиторий кода тренировки](https://huggingface.co/fierce-cats/beatrice-trainer)
- [Версия для Colab](https://github.com/w-okada/beatrice-trainer-colab)
- v.2.0.70-beta (only for m1 mac)
- [HERE](https://github.com/w-okada/voice-changer/tree/v.2)
- new feature:
- В версии VCClient для Mac на базе M1 теперь поддерживается Beatrice v2 beta.1.
- v.2.0.69-beta (only for win)
- [HERE](https://github.com/w-okada/voice-changer/tree/v.2)
- Исправления ошибок:
- Исправлена ошибка, из-за которой кнопка запуска не отображалась в случае некоторых исключений
- Настроен выходной буфер для режима серверного устройства
- Исправлена ошибка, при которой изменялась частота дискретизации при изменении настроек в режиме серверного устройства
- Исправлена ошибка при использовании японского hubert
- Прочее:
- Добавлен фильтр API хоста (выделено) для режима серверного устройства
- v.2.0.65-beta
- [HERE](https://github.com/w-okada/voice-changer/tree/v.2)
- new feature: We have supported Beatrice v2 beta.1, enabling even higher quality voice conversion.
# Что такое VC Клиент
1. Это клиентское ПО для выполнения преобразования голоса в реальном времени с использованием различных AI для преобразования голоса. Поддерживаемые AI:
- [MMVC](https://github.com/isletennos/MMVC_Trainer) (только v1)
- [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) (только v1)
- [RVC (Retrieval-based Voice Conversion)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI)
- [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) (только v1)
- [Beatrice JVS Corpus Edition](https://prj-beatrice.com/) * экспериментальный * (не по лицензии MIT, см. [readme](https://github.com/w-okada/voice-changer/blob/master/server/voice_changer/Beatrice/)), только для Windows, зависит от процессора (только v1)
- [Beatrice v2](https://prj-beatrice.com/) (только v2)
2. Распределение нагрузки между разными ПК
Реализация преобразования голоса работает по схеме "сервер-клиент". Вы можете запустить сервер MMVC на отдельном ПК для минимизации влияния на другие ресурсоёмкие процессы, такие как стриминг.
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
3. Кроссплатформенная совместимость
Поддержка Windows, Mac (включая Apple Silicon M1), Linux и Google Colaboratory.
# Как использовать
Это приложение для изменения голоса с использованием MMVC и so-vits-svc.
Есть два основных способа использования, в порядке сложности:
- Использование готового исполняемого файла
- Настройка окружения с Docker или Anaconda
## (1) Использование готовых исполняемых файлов
- Вы можете скачать и запустить исполняемые файлы.
- Смотрите [здесь](tutorials/tutorial_rvc_en_latest.md) для получения руководства. ([устранение неполадок](https://github.com/w-okada/voice-changer/blob/master/tutorials/trouble_shoot_communication_ja.md))
- Теперь попробовать можно на [Google Colaboratory](https://github.com/w-okada/voice-changer/tree/v.2/w_okada's_Voice_Changer_version_2_x.ipynb) (требуется аккаунт ngrok). Вы можете запустить его через кнопку "Открыть в Colab" в верхнем левом углу.
<img src="https://github.com/w-okada/voice-changer/assets/48346627/3f092e2d-6834-42f6-bbfd-7d389111604e" width="400" height="150">
- Мы предлагаем версии для Windows и Mac на [hugging face](https://huggingface.co/wok000/vcclient000/tree/main)
- v2 для Windows
- Пожалуйста, скачайте и используйте `vcclient_win_std_xxx.zip`. Преобразование голоса можно выполнять с использованием мощного процессора без GPU или с использованием DirectML для GPU (AMD, Nvidia). v2 поддерживает как torch, так и onnx.
- Если у вас Nvidia GPU, скачайте `vcclient_win_cuda_xxx.zip` для более быстрого преобразования.
- v2 для Mac (Apple Silicon)
- Пожалуйста, скачайте и используйте `vcclient_mac_xxx.zip`.
- v1
- Для Windows с Nvidia GPU скачайте ONNX (cpu, cuda), PyTorch (cpu, cuda).
- Для Windows с AMD/Intel GPU скачайте ONNX (cpu, DirectML) и PyTorch (cpu, cuda). AMD/Intel GPU поддерживаются только для ONNX моделей.
- Для пользователей Windows: после распаковки zip-файла запустите соответствующий `start_http.bat` файл.
- Для Mac: после распаковки zip-файла дважды щёлкните на `startHttp.command`. Если появится сообщение о невозможности проверки разработчика, нажмите Ctrl и повторно запустите.
- Если подключаетесь удалённо, используйте `.command` (Mac) или `.bat` (Windows) файл с https вместо http.
- Энкодер DDPS-SVC поддерживает только hubert-soft.
- [Скачать с hugging face](https://huggingface.co/wok000/vcclient000/tree/main)
## (2) Использование после настройки окружения с Docker или Anaconda
Клонируйте этот репозиторий и используйте его. Для Windows требуется настройка WSL2. Для Mac нужно настроить виртуальные среды Python, например Anaconda. Этот метод обеспечивает наивысшую скорость в большинстве случаев. **<font color="red"> Даже без GPU можно получить достаточную производительность на современном процессоре </font>(смотрите раздел о производительности в реальном времени ниже)**.
[Видео-инструкция по установке WSL2 и Docker](https://youtu.be/POo_Cg0eFMU)
[Видео-инструкция по установке WSL2 и Anaconda](https://youtu.be/fba9Zhsukqw)
Для запуска Docker смотрите [start docker](docker_vcclient/README_en.md).
Для запуска на Anaconda venv смотрите [руководство разработчика](README_dev_ru.md).
Для запуска на Linux с AMD GPU смотрите [руководство](tutorials/tutorial_anaconda_amd_rocm.md).
# Подпись программного обеспечения
Это ПО не подписано разработчиком. Появится предупреждение, но его можно запустить, нажав на иконку с удержанием клавиши Ctrl. Это связано с политикой безопасности Apple. Использование ПО на ваш риск.
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
https://user-images.githubusercontent.com/48346627/212569645-e30b7f4e-079d-4504-8cf8-7816c5f40b00.mp4
# Благодарности
- [Материалы Tachizunda-mon](https://seiga.nicovideo.jp/seiga/im10792934)
- [Irasutoya](https://www.irasutoya.com/)
- [Tsukuyomi-chan](https://tyc.rei-yumesaki.net)
> Это ПО использует голосовые данные бесплатного материала персонажа "Цукуёми-тян", предоставленного CV. Юмесаки Рэй.
>
> - Корпус Цукуёми-тян (CV. Юмесаки Рэй)
>
> https://tyc.rei-yumesaki.net/material/corpus/
>
> Авторское право. Юмесаки Рэй, Все права защищены.

148
docs_i18n/README_ar.md Normal file
View File

@ -0,0 +1,148 @@
[اليابانية](/README.md) /
[الإنجليزية](/docs_i18n/README_en.md) /
[الكورية](/docs_i18n/README_ko.md)/
[الصينية](/docs_i18n/README_zh.md)/
[الألمانية](/docs_i18n/README_de.md)/
[العربية](/docs_i18n/README_ar.md)/
[اليونانية](/docs_i18n/README_el.md)/
[الإسبانية](/docs_i18n/README_es.md)/
[الفرنسية](/docs_i18n/README_fr.md)/
[الإيطالية](/docs_i18n/README_it.md)/
[اللاتينية](/docs_i18n/README_la.md)/
[الماليزية](/docs_i18n/README_ms.md)/
[الروسية](/docs_i18n/README_ru.md)
*جميع اللغات باستثناء اليابانية مترجمة آليًا.
## VCClient
VCClient هو برنامج يقوم بتحويل الصوت في الوقت الحقيقي باستخدام الذكاء الاصطناعي.
## ما الجديد!
* v.2.0.78-beta
* إصلاح خطأ: تم تجنب خطأ تحميل نموذج RVC
* أصبح من الممكن الآن التشغيل بالتزامن مع الإصدار 1.x
* تمت زيادة أحجام القطع القابلة للاختيار
* v.2.0.77-beta (لـ RTX 5090 فقط، تجريبي)
* دعم الوحدات المتعلقة بـ RTX 5090 (غير مثبت لأن المطور لا يمتلك RTX 5090)
* v.2.0.76-beta
* ميزة جديدة:
* Beatrice: تنفيذ دمج المتحدثين
* Beatrice: تحويل النغمة التلقائي
* إصلاح الأخطاء:
* حل مشكلة اختيار الجهاز في وضع الخادم
* v.2.0.73-beta
* ميزة جديدة:
* تحميل نموذج beatrice المعدل
* إصلاح الأخطاء:
* تم إصلاح خطأ عدم انعكاس النغمة والصيغة في beatrice v2
* تم إصلاح خطأ عدم إمكانية إنشاء ONNX للنماذج التي تستخدم embedder Applio
## التنزيل والروابط ذات الصلة
يمكن تنزيل نسخة الويندوز ونسخة M1 Mac من مستودع hugging face.
* [مستودع VCClient](https://huggingface.co/wok000/vcclient000/tree/main)
* [مستودع Light VCClient لـ Beatrice v2](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
*1 بالنسبة للينكس، يرجى استنساخ المستودع لاستخدامه.
### روابط ذات صلة
* [مستودع كود التدريب لـ Beatrice V2](https://huggingface.co/fierce-cats/beatrice-trainer)
* [نسخة Colab من كود التدريب لـ Beatrice V2](https://github.com/w-okada/beatrice-trainer-colab)
### البرامج ذات الصلة
* [مغير الصوت في الوقت الحقيقي VCClient](https://github.com/w-okada/voice-changer)
* [برنامج قراءة النصوص TTSClient](https://github.com/w-okada/ttsclient)
* [برنامج التعرف على الصوت في الوقت الحقيقي ASRClient](https://github.com/w-okada/asrclient)
## ميزات VC Client
## يدعم نماذج الذكاء الاصطناعي المتنوعة
| نماذج الذكاء الاصطناعي | v.2 | v.1 | الترخيص |
| ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
| [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | مدعوم | مدعوم | يرجى الرجوع إلى المستودع. |
| [Beatrice v1](https://prj-beatrice.com/) | غير متاح | مدعوم (فقط للويندوز) | [خاص](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
| [Beatrice v2](https://prj-beatrice.com/) | مدعوم | غير متاح | [خاص](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
| [MMVC](https://github.com/isletennos/MMVC_Trainer) | غير متاح | مدعوم | يرجى الرجوع إلى المستودع. |
| [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | غير متاح | مدعوم | يرجى الرجوع إلى المستودع. |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | غير متاح | مدعوم | يرجى الرجوع إلى المستودع. |
## يدعم كلا من التكوين المستقل وعبر الشبكة
يدعم تحويل الصوت المكتمل على جهاز الكمبيوتر المحلي وكذلك عبر الشبكة.
عند استخدامه عبر الشبكة، يمكن تفريغ عبء تحويل الصوت إلى الخارج عند استخدامه مع تطبيقات عالية التحميل مثل الألعاب.
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
## يدعم منصات متعددة
ويندوز، ماك (M1)، ينكس، جوجل كولاب
*1 بالنسبة للينكس، يرجى استنساخ المستودع لاستخدامه.
## يوفر REST API
يمكنك إنشاء عميل باستخدام لغات البرمجة المختلفة.
يمكنك أيضًا استخدام عملاء HTTP المدمجة في نظام التشغيل مثل curl للتحكم.
## استكشاف الأخطاء وإصلاحها
[قسم الاتصال](tutorials/trouble_shoot_communication_ja.md)
## حول توقيع المطور
هذا البرنامج غير موقع من قبل المطور. ستظهر تحذيرات كما هو موضح أدناه، ولكن يمكنك تشغيله بالضغط على مفتاح التحكم أثناء النقر على الأيقونة. هذا بسبب سياسة أمان Apple. التشغيل يكون على مسؤوليتك الخاصة.
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
## الشكر والتقدير
* [مواد Tachi Zundamon](https://seiga.nicovideo.jp/seiga/im10792934)
* [إيراستويا](https://www.irasutoya.com/)
* [Tsukuyomi-chan](https://tyc.rei-yumesaki.net/)
```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
■つくよみちゃんコーパスCV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
© Rei Yumesaki
```
* [ورشة عمل صوت Amitaro](https://amitaro.net/)
* [Replikadoru](https://kikyohiroto1227.wixsite.com/kikoto-utau)
## شروط الاستخدام
* بالنسبة لمغير الصوت في الوقت الحقيقي Tsukuyomi-chan، يُحظر استخدام الصوت المحول للأغراض التالية وفقًا لشروط استخدام كوربوس Tsukuyomi-chan.
```
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
```
* بالنسبة لمغير الصوت في الوقت الحقيقي Amitaro، يُتبع شروط استخدام ورشة عمل صوت Amitaro. التفاصيل[هنا](https://amitaro.net/voice/faq/#index_id6)
```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
```
* بالنسبة لمغير الصوت في الوقت الحقيقي Kogane Mahiro، يُتبع شروط استخدام Replikadoru. التفاصيل[هنا](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
## إخلاء المسؤولية
لا نتحمل أي مسؤولية عن أي أضرار مباشرة أو غير مباشرة أو تبعية أو خاصة تنشأ عن استخدام أو عدم القدرة على استخدام هذا البرنامج.

148
docs_i18n/README_de.md Normal file
View File

@ -0,0 +1,148 @@
[Japanisch](/README.md) /
[Englisch](/docs_i18n/README_en.md) /
[Koreanisch](/docs_i18n/README_ko.md)/
[Chinesisch](/docs_i18n/README_zh.md)/
[Deutsch](/docs_i18n/README_de.md)/
[Arabisch](/docs_i18n/README_ar.md)/
[Griechisch](/docs_i18n/README_el.md)/
[Spanisch](/docs_i18n/README_es.md)/
[Französisch](/docs_i18n/README_fr.md)/
[Italienisch](/docs_i18n/README_it.md)/
[Latein](/docs_i18n/README_la.md)/
[Malaiisch](/docs_i18n/README_ms.md)/
[Russisch](/docs_i18n/README_ru.md)
*Außer Japanisch sind alle Übersetzungen maschinell.
## VCClient
VCClient ist eine Software, die mithilfe von KI eine Echtzeit-Sprachumwandlung durchführt.
## What's New!
* v.2.0.78-beta
* Fehlerbehebung: Upload-Fehler für RVC-Modell vermieden
* Gleichzeitiger Start mit Version 1.x jetzt möglich
* Auswahlbare Chunk-Größen erhöht
* v.2.0.77-beta (nur für RTX 5090, experimentell)
* Unterstützung für RTX 5090 verwandte Module (nicht verifiziert, da Entwickler kein RTX 5090 besitzt)
* v.2.0.76-beta
* neues Feature:
* Beatrice: Implementierung der Sprecherzusammenführung
* Beatrice: Automatische Tonhöhenverschiebung
* Fehlerbehebung:
* Problembehebung bei der Gerätauswahl im Servermodus
* v.2.0.73-beta
* neues Feature:
* Download des bearbeiteten Beatrice-Modells
* Fehlerbehebung:
* Fehler behoben, bei dem Pitch und Formant von Beatrice v2 nicht reflektiert wurden
* Fehler behoben, bei dem das ONNX-Modell mit dem Applio-Embedder nicht erstellt werden konnte
## Downloads und verwandte Links
Windows- und M1 Mac-Versionen können aus dem Repository von Hugging Face heruntergeladen werden.
* [VCClient-Repository](https://huggingface.co/wok000/vcclient000/tree/main)
* [Light VCClient für Beatrice v2 Repository](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
*1 Linux: Bitte klonen Sie das Repository zur Nutzung.
### Verwandte Links
* [Beatrice V2 Trainingscode-Repository](https://huggingface.co/fierce-cats/beatrice-trainer)
* [Beatrice V2 Trainingscode Colab-Version](https://github.com/w-okada/beatrice-trainer-colab)
### Verwandte Software
* [Echtzeit-Voice-Changer VCClient](https://github.com/w-okada/voice-changer)
* [Vorlesesoftware TTSClient](https://github.com/w-okada/ttsclient)
* [Echtzeit-Spracherkennungssoftware ASRClient](https://github.com/w-okada/asrclient)
## Merkmale des VC Clients
## Unterstützt verschiedene KI-Modelle
| KI-Modelle | v.2 | v.1 | Lizenz |
| ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
| [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | unterstützt | unterstützt | Bitte das Repository konsultieren. |
| [Beatrice v1](https://prj-beatrice.com/) | n/a | unterstützt (nur Windows) | [Eigen](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
| [Beatrice v2](https://prj-beatrice.com/) | unterstützt | n/a | [Eigen](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
| [MMVC](https://github.com/isletennos/MMVC_Trainer) | n/a | unterstützt | Bitte das Repository konsultieren. |
| [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | n/a | unterstützt | Bitte das Repository konsultieren. |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | n/a | unterstützt | Bitte das Repository konsultieren. |
## Unterstützt sowohl Standalone- als auch Netzwerk-Konfigurationen
Unterstützt sowohl Sprachumwandlung auf dem lokalen PC als auch über das Netzwerk.
Durch die Nutzung über das Netzwerk kann die Belastung der Sprachumwandlung auf externe Ressourcen ausgelagert werden, wenn gleichzeitig ressourcenintensive Anwendungen wie Spiele genutzt werden.
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
## Unterstützt mehrere Plattformen
Windows, Mac(M1), Linux, Google Colab
*1 Linux: Bitte klonen Sie das Repository zur Nutzung.
## Bietet REST API
Clients können in verschiedenen Programmiersprachen erstellt werden.
Außerdem kann die Bedienung mit in das Betriebssystem integrierten HTTP-Clients wie curl erfolgen.
## Fehlerbehebung
[Kommunikationsprobleme](tutorials/trouble_shoot_communication_ja.md)
## Über die Signatur des Entwicklers
Diese Software ist nicht vom Entwickler signiert. Es wird eine Warnung wie unten angezeigt, aber Sie können sie ausführen, indem Sie die Steuerungstaste gedrückt halten und auf das Symbol klicken. Dies liegt an den Sicherheitsrichtlinien von Apple. Die Ausführung erfolgt auf eigenes Risiko.
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
## Danksagungen
* [Tachizundamon-Material](https://seiga.nicovideo.jp/seiga/im10792934)
* [Irasutoya](https://www.irasutoya.com/)
* [Tsukuyomi-chan](https://tyc.rei-yumesaki.net/)
```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
■つくよみちゃんコーパスCV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
© Rei Yumesaki
```
* [Amitaro's Voice Material Studio](https://amitaro.net/)
* [Replikador](https://kikyohiroto1227.wixsite.com/kikoto-utau)
## Nutzungsbedingungen
* Für den Echtzeit-Voice-Changer Tsukuyomi-chan gelten die Nutzungsbedingungen des Tsukuyomi-chan-Korpus, und die Verwendung der umgewandelten Stimme für die folgenden Zwecke ist untersagt.
```
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
```
* Für den Echtzeit-Voice-Changer Amitaro gelten die folgenden Nutzungsbedingungen von Amitaro's Voice Material Studio. Details finden Sie[hier](https://amitaro.net/voice/faq/#index_id6)
```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
```
* Für den Echtzeit-Voice-Changer Koto Mahiro gelten die Nutzungsbedingungen von Replikador. Details finden Sie[hier](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
## Haftungsausschluss
Wir übernehmen keine Verantwortung für direkte, indirekte, Folgeschäden, resultierende oder besondere Schäden, die durch die Nutzung oder Unfähigkeit zur Nutzung dieser Software entstehen.

148
docs_i18n/README_el.md Normal file
View File

@ -0,0 +1,148 @@
[Ιαπωνικά](/README.md) /
[Αγγλικά](/docs_i18n/README_en.md) /
[Κορεατικά](/docs_i18n/README_ko.md)/
[Κινέζικα](/docs_i18n/README_zh.md)/
[Γερμανικά](/docs_i18n/README_de.md)/
[Αραβικά](/docs_i18n/README_ar.md)/
[Ελληνικά](/docs_i18n/README_el.md)/
[Ισπανικά](/docs_i18n/README_es.md)/
[Γαλλικά](/docs_i18n/README_fr.md)/
[Ιταλικά](/docs_i18n/README_it.md)/
[Λατινικά](/docs_i18n/README_la.md)/
[Μαλαισιανά](/docs_i18n/README_ms.md)/
[Ρωσικά](/docs_i18n/README_ru.md)
*Οι γλώσσες εκτός των Ιαπωνικών είναι μεταφρασμένες αυτόματα.
## VCClient
Το VCClient είναι λογισμικό που χρησιμοποιεί AI για μετατροπή φωνής σε πραγματικό χρόνο.
## What's New!
* v.2.0.78-beta
* διόρθωση σφάλματος: αποφεύχθηκε το σφάλμα μεταφόρτωσης του μοντέλου RVC
* Τώρα είναι δυνατή η ταυτόχρονη εκκίνηση με την έκδοση 1.x
* Αυξήθηκαν τα διαθέσιμα μεγέθη chunk
* v.2.0.77-beta (μόνο για RTX 5090, πειραματικό)
* Υποστήριξη για σχετικές μονάδες RTX 5090 (δεν επαληθεύτηκε καθώς ο προγραμματιστής δεν διαθέτει RTX 5090)
* v.2.0.76-beta
* νέα δυνατότητα:
* Beatrice: Εφαρμογή συγχώνευσης ομιλητών
* Beatrice: Αυτόματη μετατόπιση τόνου
* διόρθωση σφαλμάτων:
* Αντιμετώπιση προβλημάτων κατά την επιλογή συσκευής σε λειτουργία διακομιστή
* v.2.0.73-beta
* νέα δυνατότητα:
* Λήψη του επεξεργασμένου μοντέλου beatrice
* διόρθωση σφαλμάτων:
* Διορθώθηκε το σφάλμα όπου το pitch και το formant του beatrice v2 δεν εφαρμόζονταν
* Διορθώθηκε το σφάλμα όπου δεν μπορούσε να δημιουργηθεί το ONNX για μοντέλα που χρησιμοποιούν το embedder του Applio
## Λήψη και σχετικοί σύνδεσμοι
Οι εκδόσεις για Windows και M1 Mac μπορούν να ληφθούν από το αποθετήριο του hugging face.
* [Αποθετήριο του VCClient](https://huggingface.co/wok000/vcclient000/tree/main)
* [Αποθετήριο για το Light VCClient for Beatrice v2](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
*1 Για Linux, παρακαλώ κλωνοποιήστε το αποθετήριο.
### Σχετικοί σύνδεσμοι
* [Αποθετήριο κώδικα εκπαίδευσης Beatrice V2](https://huggingface.co/fierce-cats/beatrice-trainer)
* [Έκδοση Colab του κώδικα εκπαίδευσης Beatrice V2](https://github.com/w-okada/beatrice-trainer-colab)
### Σχετικό λογισμικό
* [Μετατροπέας φωνής σε πραγματικό χρόνο VCClient](https://github.com/w-okada/voice-changer)
* [Λογισμικό ανάγνωσης TTSClient](https://github.com/w-okada/ttsclient)
* [Λογισμικό αναγνώρισης φωνής σε πραγματικό χρόνο ASRClient](https://github.com/w-okada/asrclient)
## Χαρακτηριστικά του VC Client
## Υποστήριξη ποικίλων μοντέλων AI
| Μοντέλα AI | v.2 | v.1 | Άδεια |
| ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
| [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | υποστηρίζεται | υποστηρίζεται | Παρακαλώ ανατρέξτε στο αποθετήριο. |
| [Beatrice v1](https://prj-beatrice.com/) | n/a | υποστηρίζεται (μόνο win) | [ιδιόκτητο](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
| [Beatrice v2](https://prj-beatrice.com/) | υποστηρίζεται | n/a | [ιδιόκτητο](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
| [MMVC](https://github.com/isletennos/MMVC_Trainer) | n/a | υποστηρίζεται | Παρακαλώ ανατρέξτε στο αποθετήριο. |
| [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | n/a | υποστηρίζεται | Παρακαλώ ανατρέξτε στο αποθετήριο. |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | n/a | υποστηρίζεται | Παρακαλώ ανατρέξτε στο αποθετήριο. |
## Υποστήριξη τόσο για αυτόνομη όσο και για δικτυακή διαμόρφωση
Υποστηρίζεται η μετατροπή φωνής που ολοκληρώνεται σε τοπικό υπολογιστή καθώς και μέσω δικτύου.
Χρησιμοποιώντας το μέσω δικτύου, μπορείτε να εκφορτώσετε το φορτίο της μετατροπής φωνής σε εξωτερικό χώρο όταν χρησιμοποιείτε ταυτόχρονα εφαρμογές υψηλής φόρτωσης όπως παιχνίδια.
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
## Υποστήριξη πολλαπλών πλατφορμών
Windows, Mac(M1), Linux, Google Colab
*1 Για Linux, παρακαλώ κλωνοποιήστε το αποθετήριο.
## Παροχή REST API
Μπορείτε να δημιουργήσετε πελάτες σε διάφορες γλώσσες προγραμματισμού.
Επίσης, μπορείτε να το χειριστείτε χρησιμοποιώντας HTTP πελάτες ενσωματωμένους στο λειτουργικό σύστημα όπως το curl.
## Αντιμετώπιση προβλημάτων
[Θέματα επικοινωνίας](tutorials/trouble_shoot_communication_ja.md)
## Σχετικά με την υπογραφή του προγραμματιστή
Αυτό το λογισμικό δεν είναι υπογεγραμμένο από τον προγραμματιστή. Εμφανίζεται προειδοποίηση όπως παρακάτω, αλλά μπορείτε να το εκτελέσετε κάνοντας κλικ στο εικονίδιο ενώ κρατάτε πατημένο το πλήκτρο ελέγχου. Αυτό οφείλεται στην πολιτική ασφαλείας της Apple. Η εκτέλεση γίνεται με δική σας ευθύνη.
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
## Ευχαριστίες
* [Υλικό από το Tachizundamon](https://seiga.nicovideo.jp/seiga/im10792934)
* [Irasutoya](https://www.irasutoya.com/)
* [Tsukuyomi-chan](https://tyc.rei-yumesaki.net/)
```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
■つくよみちゃんコーパスCV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
© Rei Yumesaki
```
* [Εργαστήριο φωνητικών υλικών Amitaro](https://amitaro.net/)
* [Reprikadoru](https://kikyohiroto1227.wixsite.com/kikoto-utau)
## Όροι χρήσης
* Για το μετατροπέα φωνής σε πραγματικό χρόνο Tsukuyomi-chan, απαγορεύεται η χρήση της μετατραπείσας φωνής για τους παρακάτω σκοπούς σύμφωνα με τους όρους χρήσης του Tsukuyomi-chan corpus.
```
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
```
* Για το μετατροπέα φωνής σε πραγματικό χρόνο Amitaro, ισχύουν οι ακόλουθοι όροι χρήσης του εργαστηρίου φωνητικών υλικών Amitaro. Για λεπτομέρειες,[εδώ](https://amitaro.net/voice/faq/#index_id6)
```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
```
* Για το μετατροπέα φωνής σε πραγματικό χρόνο Kogane Mahiro, ισχύουν οι όροι χρήσης του Reprikadoru. Για λεπτομέρειες,[εδώ](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
## Αποποίηση ευθυνών
Δεν φέρουμε καμία ευθύνη για οποιαδήποτε άμεση, έμμεση, επακόλουθη, ή ειδική ζημία που προκύπτει από τη χρήση ή την αδυναμία χρήσης αυτού του λογισμικού.

148
docs_i18n/README_en.md Normal file
View File

@ -0,0 +1,148 @@
[Japanese](/README.md) /
[English](/docs_i18n/README_en.md) /
[Korean](/docs_i18n/README_ko.md)/
[Chinese](/docs_i18n/README_zh.md)/
[German](/docs_i18n/README_de.md)/
[Arabic](/docs_i18n/README_ar.md)/
[Greek](/docs_i18n/README_el.md)/
[Spanish](/docs_i18n/README_es.md)/
[French](/docs_i18n/README_fr.md)/
[Italian](/docs_i18n/README_it.md)/
[Latin](/docs_i18n/README_la.md)/
[Malay](/docs_i18n/README_ms.md)/
[Russian](/docs_i18n/README_ru.md)
*Languages other than Japanese are machine translated.
## VCClient
VCClient is software that performs real-time voice conversion using AI.
## What's New!
* v.2.0.78-beta
* bugfix: Avoided upload error for RVC model
* Now possible to run simultaneously with ver.1.x
* Increased selectable chunk sizes
* v.2.0.77-beta (only for RTX 5090, experimental)
* Related modules support for RTX 5090 (not verified as developer does not own RTX 5090)
* v.2.0.76-beta
* new feature:
* Beatrice: Implementation of speaker merge
* Beatrice: Auto pitch shift
* bugfix:
* Fixed issue with device selection in server mode
* v.2.0.73-beta
* new feature:
* Download edited Beatrice model
* bugfix:
* Fixed a bug where pitch and formant of Beatrice v2 were not reflected
* Fixed a bug where ONNX could not be created for models using Applio's embedder
## Download and Related Links
Windows and M1 Mac versions can be downloaded from the hugging face repository.
* [VCClient Repository](https://huggingface.co/wok000/vcclient000/tree/main)
* [Light VCClient for Beatrice v2 Repository](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
*1 Please clone the repository for Linux use.
### Related Links
* [Beatrice V2 Training Code Repository](https://huggingface.co/fierce-cats/beatrice-trainer)
* [Beatrice V2 Training Code Colab Version](https://github.com/w-okada/beatrice-trainer-colab)
### Related Software
* [Real-time Voice Changer VCClient](https://github.com/w-okada/voice-changer)
* [Text-to-Speech Software TTSClient](https://github.com/w-okada/ttsclient)
* [Real-time Speech Recognition Software ASRClient](https://github.com/w-okada/asrclient)
## Features of VC Client
## Supports various AI models
| AI Model | v.2 | v.1 | License |
| ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
| [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | supported | supported | Please refer to the repository. |
| [Beatrice v1](https://prj-beatrice.com/) | n/a | supported (only win) | [Proprietary](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
| [Beatrice v2](https://prj-beatrice.com/) | supported | n/a | [Proprietary](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
| [MMVC](https://github.com/isletennos/MMVC_Trainer) | n/a | supported | Please refer to the repository. |
| [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | n/a | supported | Please refer to the repository. |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | n/a | supported | Please refer to the repository. |
## Supports both standalone and network configurations
Supports voice conversion completed on a local PC as well as voice conversion via network.
By using it over a network, you can offload the voice conversion load externally when using it simultaneously with high-load applications such as games.
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
## Compatible with multiple platforms
Windows, Mac(M1), Linux, Google Colab
*1 Please clone the repository for Linux use.
## Provides REST API
Clients can be created in various programming languages.
You can also operate it using HTTP clients built into the OS, such as curl.
## Troubleshoot
[Communication Edition](tutorials/trouble_shoot_communication_ja.md)
## About Developer Signature
This software is not signed by the developer. A warning will appear as shown below, but you can run it by clicking the icon while holding down the control key. This is due to Apple's security policy. Execution is at your own risk.
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
## Acknowledgments
* [Tachizundamon Materials](https://seiga.nicovideo.jp/seiga/im10792934)
* [Irasutoya](https://www.irasutoya.com/)
* [Tsukuyomi-chan](https://tyc.rei-yumesaki.net/)
```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
■つくよみちゃんコーパスCV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
© Rei Yumesaki
```
* [Amitaro's Voice Material Workshop](https://amitaro.net/)
* [Replica Doll](https://kikyohiroto1227.wixsite.com/kikoto-utau)
## Terms of Use
* Regarding the real-time voice changer Tsukuyomi-chan, it is prohibited to use the converted voice for the following purposes in accordance with the terms of use of the Tsukuyomi-chan corpus.
```
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
```
* Regarding the real-time voice changer Amitaro, it complies with the following terms of use of Amitaro's Voice Material Workshop. For details,[here](https://amitaro.net/voice/faq/#index_id6)
```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
```
* Regarding the real-time voice changer Koto Mahiro, it complies with the terms of use of Replica Doll. For details,[here](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
## Disclaimer
We are not responsible for any direct, indirect, consequential, or special damages arising from the use or inability to use this software.

148
docs_i18n/README_es.md Normal file
View File

@ -0,0 +1,148 @@
[Japonés](/README.md) /
[Inglés](/docs_i18n/README_en.md) /
[Coreano](/docs_i18n/README_ko.md)/
[Chino](/docs_i18n/README_zh.md)/
[Alemán](/docs_i18n/README_de.md)/
[Árabe](/docs_i18n/README_ar.md)/
[Griego](/docs_i18n/README_el.md)/
[Español](/docs_i18n/README_es.md)/
[Francés](/docs_i18n/README_fr.md)/
[Italiano](/docs_i18n/README_it.md)/
[Latín](/docs_i18n/README_la.md)/
[Malayo](/docs_i18n/README_ms.md)/
[Ruso](/docs_i18n/README_ru.md)
*Los idiomas distintos al japonés son traducciones automáticas.
## VCClient
VCClient es un software que utiliza IA para realizar conversión de voz en tiempo real.
## What's New!
* v.2.0.78-beta
* corrección de errores: se evitó el error de carga del modelo RVC
* Ahora es posible ejecutar simultáneamente con la versión 1.x
* Se aumentaron los tamaños de chunk seleccionables
* v.2.0.77-beta (solo para RTX 5090, experimental)
* Soporte para módulos relacionados con RTX 5090 (no verificado ya que el desarrollador no posee RTX 5090)
* v.2.0.76-beta
* nueva característica:
* Beatrice: Implementación de fusión de hablantes
* Beatrice: Cambio de tono automático
* corrección de errores:
* Solución de problemas al seleccionar dispositivos en modo servidor
* v.2.0.73-beta
* nueva característica:
* Descarga del modelo Beatrice editado
* corrección de errores:
* Se corrigió un error donde el pitch y el formante de Beatrice v2 no se reflejaban
* Se corrigió un error donde no se podía crear ONNX para modelos que usan el embedder de Applio
## Descargas y enlaces relacionados
Las versiones para Windows y Mac M1 se pueden descargar desde el repositorio de hugging face.
* [Repositorio de VCClient](https://huggingface.co/wok000/vcclient000/tree/main)
* [Repositorio de Light VCClient para Beatrice v2](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
*1 Para Linux, clone el repositorio para su uso.
### Enlaces relacionados
* [Repositorio de código de entrenamiento de Beatrice V2](https://huggingface.co/fierce-cats/beatrice-trainer)
* [Versión Colab del código de entrenamiento de Beatrice V2](https://github.com/w-okada/beatrice-trainer-colab)
### Software relacionado
* [Cambiador de voz en tiempo real VCClient](https://github.com/w-okada/voice-changer)
* [Software de lectura TTSClient](https://github.com/w-okada/ttsclient)
* [Software de reconocimiento de voz en tiempo real ASRClient](https://github.com/w-okada/asrclient)
## Características de VC Client
## Soporta diversos modelos de IA
| Modelos de IA | v.2 | v.1 | Licencia |
| ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
| [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | soportado | soportado | Consulte el repositorio. |
| [Beatrice v1](https://prj-beatrice.com/) | n/a | soportado (solo win) | [Propio](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
| [Beatrice v2](https://prj-beatrice.com/) | soportado | n/a | [Propio](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
| [MMVC](https://github.com/isletennos/MMVC_Trainer) | n/a | soportado | Consulte el repositorio. |
| [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | n/a | soportado | Consulte el repositorio. |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | n/a | soportado | Consulte el repositorio. |
## Soporta configuraciones tanto autónomas como a través de la red
Soporta tanto la conversión de voz completada en una PC local como la conversión de voz a través de la red.
Al utilizarlo a través de la red, puede descargar la carga de conversión de voz externamente cuando se usa simultáneamente con aplicaciones de alta carga como juegos.
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
## Compatible con múltiples plataformas
Windows, Mac(M1), Linux, Google Colab
*1 Para Linux, clone el repositorio para su uso.
## Proporciona API REST
Puede crear clientes en varios lenguajes de programación.
Además, puede operar usando clientes HTTP integrados en el sistema operativo como curl.
## Solución de problemas
[Sección de comunicación](tutorials/trouble_shoot_communication_ja.md)
## Sobre la firma del desarrollador
Este software no está firmado por el desarrollador. Aunque aparece una advertencia como se muestra a continuación, puede ejecutarlo haciendo clic en el icono mientras mantiene presionada la tecla de control. Esto se debe a la política de seguridad de Apple. La ejecución es bajo su propio riesgo.
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
## Agradecimientos
* [Material de Tachi Zundamon](https://seiga.nicovideo.jp/seiga/im10792934)
* [Ilustraciones de Irasutoya](https://www.irasutoya.com/)
* [Tsukuyomi-chan](https://tyc.rei-yumesaki.net/)
```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
■つくよみちゃんコーパスCV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
© Rei Yumesaki
```
* [Taller de voz de Amitaro](https://amitaro.net/)
* [Replikador](https://kikyohiroto1227.wixsite.com/kikoto-utau)
## Términos de uso
* En cuanto a Tsukuyomi-chan, el cambiador de voz en tiempo real, está prohibido usar la voz convertida para los siguientes propósitos, de acuerdo con los términos de uso del corpus de Tsukuyomi-chan.
```
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
```
* En cuanto a Amitaro, el cambiador de voz en tiempo real, se adhiere a los siguientes términos de uso del Taller de voz de Amitaro. Para más detalles, [aquí](https://amitaro.net/voice/faq/#index_id6)
```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
```
* En cuanto a Koto Mahiro, el cambiador de voz en tiempo real, se adhiere a los términos de uso de Replikador. Para más detalles, [aquí](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
## Descargo de responsabilidad
No nos hacemos responsables de ningún daño directo, indirecto, consecuente, resultante o especial que surja del uso o la imposibilidad de uso de este software.

148
docs_i18n/README_fr.md Normal file
View File

@ -0,0 +1,148 @@
[Japonais](/README.md) /
[Anglais](/docs_i18n/README_en.md) /
[Coréen](/docs_i18n/README_ko.md)/
[Chinois](/docs_i18n/README_zh.md)/
[Allemand](/docs_i18n/README_de.md)/
[Arabe](/docs_i18n/README_ar.md)/
[Grec](/docs_i18n/README_el.md)/
[Espagnol](/docs_i18n/README_es.md)/
[Français](/docs_i18n/README_fr.md)/
[Italien](/docs_i18n/README_it.md)/
[Latin](/docs_i18n/README_la.md)/
[Malais](/docs_i18n/README_ms.md)/
[Russe](/docs_i18n/README_ru.md)
*Les langues autres que le japonais sont traduites automatiquement.
## VCClient
VCClient est un logiciel qui utilise l'IA pour effectuer une conversion vocale en temps réel.
## What's New!
* v.2.0.78-beta
* correction de bug : évitement de l'erreur de téléchargement du modèle RVC
* Il est désormais possible de lancer simultanément avec la version 1.x
* Augmentation des tailles de chunk sélectionnables
* v.2.0.77-beta (uniquement pour RTX 5090, expérimental)
* Support des modules liés à RTX 5090 (non vérifié car le développeur ne possède pas de RTX 5090)
* v.2.0.76-beta
* nouvelle fonctionnalité :
* Beatrice : Implémentation de la fusion des locuteurs
* Beatrice : Pitch shift automatique
* correction de bug :
* Correction d'un problème lors de la sélection de l'appareil en mode serveur
* v.2.0.73-beta
* nouvelle fonctionnalité :
* Téléchargement du modèle Beatrice modifié
* correction de bug :
* Correction du bug où le pitch et le formant de Beatrice v2 n'étaient pas appliqués
* Correction du bug empêchant la création de l'ONNX pour les modèles utilisant l'embedder d'Applio
## Téléchargement et liens associés
Les versions Windows et Mac M1 peuvent être téléchargées depuis le référentiel hugging face.
* [Référentiel de VCClient](https://huggingface.co/wok000/vcclient000/tree/main)
* [Référentiel de Light VCClient pour Beatrice v2](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
*1 Pour Linux, veuillez cloner le référentiel pour l'utiliser.
### Liens associés
* [Référentiel de code d'entraînement Beatrice V2](https://huggingface.co/fierce-cats/beatrice-trainer)
* [Version Colab du code d'entraînement Beatrice V2](https://github.com/w-okada/beatrice-trainer-colab)
### Logiciels associés
* [Changeur de voix en temps réel VCClient](https://github.com/w-okada/voice-changer)
* [Logiciel de synthèse vocale TTSClient](https://github.com/w-okada/ttsclient)
* [Logiciel de reconnaissance vocale en temps réel ASRClient](https://github.com/w-okada/asrclient)
## Caractéristiques de VC Client
## Prend en charge divers modèles d'IA
| Modèle d'IA | v.2 | v.1 | Licence |
| ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
| [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | pris en charge | pris en charge | Veuillez consulter le référentiel. |
| [Beatrice v1](https://prj-beatrice.com/) | n/a | pris en charge (uniquement Windows) | [Propriétaire](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
| [Beatrice v2](https://prj-beatrice.com/) | pris en charge | n/a | [Propriétaire](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
| [MMVC](https://github.com/isletennos/MMVC_Trainer) | n/a | pris en charge | Veuillez consulter le référentiel. |
| [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | n/a | pris en charge | Veuillez consulter le référentiel. |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | n/a | pris en charge | Veuillez consulter le référentiel. |
## Prend en charge les configurations autonomes et via réseau
Prend en charge la conversion vocale entièrement sur PC local ainsi que via réseau.
En utilisant via réseau, la charge de conversion vocale peut être déportée à l'extérieur lors de l'utilisation simultanée avec des applications à forte charge comme les jeux.
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
## Compatible avec plusieurs plateformes
Windows, Mac(M1), Linux, Google Colab
*1 Pour Linux, veuillez cloner le référentiel pour l'utiliser.
## Fournit une API REST
Vous pouvez créer des clients dans divers langages de programmation.
Vous pouvez également utiliser des clients HTTP intégrés au système d'exploitation comme curl pour les opérations.
## Dépannage
[Communication](tutorials/trouble_shoot_communication_ja.md)
## À propos de la signature du développeur
Ce logiciel n'est pas signé par le développeur. Un avertissement s'affiche comme ci-dessous, mais vous pouvez l'exécuter en cliquant sur l'icône tout en maintenant la touche Contrôle. Ceci est dû à la politique de sécurité d'Apple. L'exécution est à vos propres risques.
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
## Remerciements
* [Matériel de Tachi Zundamon](https://seiga.nicovideo.jp/seiga/im10792934)
* [Irasutoya](https://www.irasutoya.com/)
* [Tsukuyomi-chan](https://tyc.rei-yumesaki.net/)
```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
■つくよみちゃんコーパスCV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
© Rei Yumesaki
```
* [Atelier de voix d'Amitaro](https://amitaro.net/)
* [Replika Doll](https://kikyohiroto1227.wixsite.com/kikoto-utau)
## Conditions d'utilisation
* En ce qui concerne le changeur de voix en temps réel Tsukuyomi-chan, l'utilisation de la voix convertie est interdite aux fins suivantes, conformément aux conditions d'utilisation du corpus Tsukuyomi-chan.
```
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
```
* En ce qui concerne le changeur de voix en temps réel Amitaro, il est conforme aux conditions d'utilisation de l'atelier de voix d'Amitaro. Pour plus de détails, [ici](https://amitaro.net/voice/faq/#index_id6)
```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
```
* En ce qui concerne le changeur de voix en temps réel Koto Mahiro, il est conforme aux conditions d'utilisation de Replika Doll. Pour plus de détails, [ici](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
## Clause de non-responsabilité
Nous déclinons toute responsabilité pour tout dommage direct, indirect, consécutif, résultant ou spécial causé par l'utilisation ou l'incapacité d'utiliser ce logiciel.

148
docs_i18n/README_it.md Normal file
View File

@ -0,0 +1,148 @@
[Giapponese](/README.md) /
[Inglese](/docs_i18n/README_en.md) /
[Coreano](/docs_i18n/README_ko.md)/
[Cinese](/docs_i18n/README_zh.md)/
[Tedesco](/docs_i18n/README_de.md)/
[Arabo](/docs_i18n/README_ar.md)/
[Greco](/docs_i18n/README_el.md)/
[Spagnolo](/docs_i18n/README_es.md)/
[Francese](/docs_i18n/README_fr.md)/
[Italiano](/docs_i18n/README_it.md)/
[Latino](/docs_i18n/README_la.md)/
[Malese](/docs_i18n/README_ms.md)/
[Russo](/docs_i18n/README_ru.md)
*Le lingue diverse dal giapponese sono tradotte automaticamente.
## VCClient
VCClient è un software che utilizza l'IA per la conversione vocale in tempo reale.
## What's New!
* v.2.0.78-beta
* correzione bug: evitato errore di upload del modello RVC
* Ora è possibile l'avvio simultaneo con la versione 1.x
* Aumentate le dimensioni dei chunk selezionabili
* v.2.0.77-beta (solo per RTX 5090, sperimentale)
* Supporto per moduli relativi a RTX 5090 (non verificato poiché lo sviluppatore non possiede RTX 5090)
* v.2.0.76-beta
* nuova funzionalità:
* Beatrice: Implementazione della fusione degli speaker
* Beatrice: Auto pitch shift
* correzione bug:
* Risolto il problema nella selezione del dispositivo in modalità server
* v.2.0.73-beta
* nuova funzionalità:
* Download del modello beatrice modificato
* correzione bug:
* Corretto un bug per cui pitch e formant di beatrice v2 non venivano applicati
* Corretto un bug per cui non era possibile creare ONNX per i modelli che utilizzano l'embedder di Applio
## Download e link correlati
Le versioni per Windows e Mac M1 possono essere scaricate dal repository di hugging face.
* [Repository di VCClient](https://huggingface.co/wok000/vcclient000/tree/main)
* [Repository di Light VCClient per Beatrice v2](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
*1 Per Linux, clona il repository per l'uso.
### Link correlati
* [Repository del codice di allenamento Beatrice V2](https://huggingface.co/fierce-cats/beatrice-trainer)
* [Versione Colab del codice di allenamento Beatrice V2](https://github.com/w-okada/beatrice-trainer-colab)
### Software correlato
* [Cambiavoce in tempo reale VCClient](https://github.com/w-okada/voice-changer)
* [Software di sintesi vocale TTSClient](https://github.com/w-okada/ttsclient)
* [Software di riconoscimento vocale in tempo reale ASRClient](https://github.com/w-okada/asrclient)
## Caratteristiche di VC Client
## Supporta vari modelli di IA
| Modello di IA | v.2 | v.1 | Licenza |
| ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
| [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | supportato | supportato | Si prega di consultare il repository. |
| [Beatrice v1](https://prj-beatrice.com/) | n/a | supportato (solo win) | [Proprietario](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
| [Beatrice v2](https://prj-beatrice.com/) | supportato | n/a | [Proprietario](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
| [MMVC](https://github.com/isletennos/MMVC_Trainer) | n/a | supportato | Si prega di consultare il repository. |
| [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | n/a | supportato | Si prega di consultare il repository. |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | n/a | supportato | Si prega di consultare il repository. |
## Supporta sia la configurazione standalone che tramite rete
Supporta sia la conversione vocale completata su PC locale che tramite rete.
Utilizzando tramite rete, è possibile scaricare il carico della conversione vocale su un dispositivo esterno quando si utilizzano applicazioni ad alto carico come i giochi.
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
## Compatibile con più piattaforme
Windows, Mac(M1), Linux, Google Colab
*1 Per Linux, clona il repository per l'uso.
## Fornisce un'API REST
È possibile creare client in vari linguaggi di programmazione.
È inoltre possibile operare utilizzando client HTTP incorporati nel sistema operativo come curl.
## Risoluzione dei problemi
[Sezione comunicazione](tutorials/trouble_shoot_communication_ja.md)
## Informazioni sulla firma dello sviluppatore
Questo software non è firmato dallo sviluppatore. Anche se viene visualizzato un avviso come di seguito, è possibile eseguirlo facendo clic sull'icona tenendo premuto il tasto di controllo. Questo è dovuto alla politica di sicurezza di Apple. L'esecuzione è a proprio rischio.
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
## Ringraziamenti
* [Materiale di Tachi Zundamon](https://seiga.nicovideo.jp/seiga/im10792934)
* [Irasutoya](https://www.irasutoya.com/)
* [Tsukuyomi-chan](https://tyc.rei-yumesaki.net/)
```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
■つくよみちゃんコーパスCV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
© Rei Yumesaki
```
* [Atelier di materiali vocali di Amitaro](https://amitaro.net/)
* [Replica Doll](https://kikyohiroto1227.wixsite.com/kikoto-utau)
## Termini di utilizzo
* Per quanto riguarda il cambiavoce in tempo reale Tsukuyomi-chan, è vietato utilizzare la voce convertita per i seguenti scopi in conformità con i termini di utilizzo del corpus di Tsukuyomi-chan.
```
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
```
* Per quanto riguarda il cambiavoce in tempo reale Amitaro, si applicano i seguenti termini di utilizzo dell'Atelier di materiali vocali di Amitaro. Per dettagli, [qui](https://amitaro.net/voice/faq/#index_id6)
```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
```
* Per quanto riguarda il cambiavoce in tempo reale Koto Mahiro, si applicano i termini di utilizzo di Replica Doll. Per dettagli, [qui](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
## Clausola di esclusione della responsabilità
Non ci assumiamo alcuna responsabilità per eventuali danni diretti, indiretti, consequenziali, risultanti o speciali derivanti dall'uso o dall'impossibilità di utilizzare questo software.

148
docs_i18n/README_ja.md Normal file
View File

@ -0,0 +1,148 @@
[日本語](/README.md) /
[英語](/docs_i18n/README_en.md) /
[韓国語](/docs_i18n/README_ko.md)/
[中国語](/docs_i18n/README_zh.md)/
[ドイツ語](/docs_i18n/README_de.md)/
[アラビア語](/docs_i18n/README_ar.md)/
[ギリシャ語](/docs_i18n/README_el.md)/
[スペイン語](/docs_i18n/README_es.md)/
[フランス語](/docs_i18n/README_fr.md)/
[イタリア語](/docs_i18n/README_it.md)/
[ラテン語](/docs_i18n/README_la.md)/
[マレー語](/docs_i18n/README_ms.md)/
[ロシア語](/docs_i18n/README_ru.md)
*日本語以外は機械翻訳です。
## VCClient
VCClientは、AIを用いてリアルタイム音声変換を行うソフトウェアです。
## What's New!
* v.2.0.78-beta
* bugfix: RVCモデルのアップロードエラーを回避
* ver.1.x との同時起動ができるようになりました。
* 選択できるchunk sizeを増やしました。
* v.2.0.77-beta (only for RTX 5090, experimental)
* 関連モジュールを5090対応 (開発者がRTX5090未所持のため、動作未検証)
* v.2.0.76-beta
* new feature:
* Beatrice: 話者マージの実装
* Beatrice: オートピッチシフト
* bugfix:
* サーバモードのデバイス選択時の不具合対応
* v.2.0.73-beta
* new feature:
* 編集したbeatrice modelのダウンロード
* bugfix:
* beatrice v2 のpitch, formantが反映されないバグを修正
* Applio のembedderを使用しているモデルのONNXができないバグを修正
## ダウンロードと関連リンク
Windows版、 M1 Mac版はhugging faceのリポジトリからダウンロードできます。
* [VCClient のリポジトリ](https://huggingface.co/wok000/vcclient000/tree/main)
* [Light VCClient for Beatrice v2 のリポジトリ](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
*1 Linuxはリポジトリをcloneしてお使いください。
### 関連リンク
* [Beatrice V2 トレーニングコードのリポジトリ](https://huggingface.co/fierce-cats/beatrice-trainer)
* [Beatrice V2 トレーニングコード Colab版](https://github.com/w-okada/beatrice-trainer-colab)
### 関連ソフトウェア
* [リアルタイムボイスチェンジャ VCClient](https://github.com/w-okada/voice-changer)
* [読み上げソフトウェア TTSClient](https://github.com/w-okada/ttsclient)
* [リアルタイム音声認識ソフトウェア ASRClient](https://github.com/w-okada/asrclient)
## VC Clientの特徴
## 多様なAIモデルをサポート
| AIモデル | v.2 | v.1 | ライセンス |
| ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
| [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | supported | supported | リポジトリを参照してください。 |
| [Beatrice v1](https://prj-beatrice.com/) | n/a | supported (only win) | [独自](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
| [Beatrice v2](https://prj-beatrice.com/) | supported | n/a | [独自](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
| [MMVC](https://github.com/isletennos/MMVC_Trainer) | n/a | supported | リポジトリを参照してください。 |
| [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | n/a | supported | リポジトリを参照してください。 |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | n/a | supported | リポジトリを参照してください。 |
## スタンドアロン、ネットワーク経由の両構成をサポート
ローカルPCで完結した音声変換も、ネットワークを介した音声変換もサポートしています。
ネットワークを介した利用を行うことで、ゲームなどの高負荷なアプリケーションと同時に使用する場合に音声変換の負荷を外部にオフロードすることができます。
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
## 複数プラットフォームに対応
Windows, Mac(M1), Linux, Google Colab
*1 Linuxはリポジトリをcloneしてお使いください。
## REST APIを提供
各種プログラミング言語でクライアントを作成することができます。
また、curlなどのOSに組み込まれているHTTPクライアントを使って操作ができます。
## トラブルシュート
[通信編](tutorials/trouble_shoot_communication_ja.md)
## 開発者の署名について
本ソフトウェアは開発元の署名しておりません。下記のように警告が出ますが、コントロールキーを押しながらアイコンをクリックすると実行できるようになります。これは Apple のセキュリティポリシーによるものです。実行は自己責任となります。
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
## Acknowledgments
* [立ちずんだもん素材](https://seiga.nicovideo.jp/seiga/im10792934)
* [いらすとや](https://www.irasutoya.com/)
* [つくよみちゃん](https://tyc.rei-yumesaki.net/)
```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
■つくよみちゃんコーパスCV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
© Rei Yumesaki
```
* [あみたろの声素材工房](https://amitaro.net/)
* [れぷりかどーる](https://kikyohiroto1227.wixsite.com/kikoto-utau)
## 利用規約
* リアルタイムボイスチェンジャーつくよみちゃんについては、つくよみちゃんコーパスの利用規約に準じ、次の目的で変換後の音声を使用することを禁止します。
```
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
```
* リアルタイムボイスチェンジャーあみたろについては、あみたろの声素材工房様の次の利用規約に準じます。詳細は[こちら](https://amitaro.net/voice/faq/#index_id6)
```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
```
* リアルタイムボイスチェンジャー黄琴まひろについては、れぷりかどーるの利用規約に準じます。詳細は[こちら](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
## 免責事項
本ソフトウェアの使用または使用不能により生じたいかなる直接損害・間接損害・波及的損害・結果的損害 または特別損害についても、一切責任を負いません。

148
docs_i18n/README_ko.md Normal file
View File

@ -0,0 +1,148 @@
[일본어](/README.md) /
[영어](/docs_i18n/README_en.md) /
[한국어](/docs_i18n/README_ko.md)/
[중국어](/docs_i18n/README_zh.md)/
[독일어](/docs_i18n/README_de.md)/
[아랍어](/docs_i18n/README_ar.md)/
[그리스어](/docs_i18n/README_el.md)/
[스페인어](/docs_i18n/README_es.md)/
[프랑스어](/docs_i18n/README_fr.md)/
[이탈리아어](/docs_i18n/README_it.md)/
[라틴어](/docs_i18n/README_la.md)/
[말레이어](/docs_i18n/README_ms.md)/
[러시아어](/docs_i18n/README_ru.md)
*일본어 외에는 기계 번역입니다.
## VCClient
VCClient는 AI를 사용하여 실시간 음성 변환을 수행하는 소프트웨어입니다.
## What's New!
* v.2.0.78-beta
* 버그 수정: RVC 모델 업로드 오류 회피
* ver.1.x와 동시에 실행 가능해졌습니다.
* 선택 가능한 chunk size를 늘렸습니다.
* v.2.0.77-beta (RTX 5090 전용, 실험적)
* RTX 5090 관련 모듈 지원 (개발자가 RTX 5090을 보유하지 않아 검증되지 않음)
* v.2.0.76-beta
* new feature:
* Beatrice: 화자 병합 구현
* Beatrice: 자동 피치 시프트
* bugfix:
* 서버 모드에서 장치 선택 시의 문제 해결
* v.2.0.73-beta
* new feature:
* 편집한 beatrice 모델 다운로드
* bugfix:
* beatrice v2의 pitch, formant가 반영되지 않는 버그를 수정
* Applio의 embedder를 사용하고 있는 모델의 ONNX가 생성되지 않는 버그를 수정
## 다운로드 및 관련 링크
Windows 버전, M1 Mac 버전은 hugging face의 리포지토리에서 다운로드할 수 있습니다.
* [VCClient의 리포지토리](https://huggingface.co/wok000/vcclient000/tree/main)
* [Light VCClient for Beatrice v2의 리포지토리](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
*1 Linux는 리포지토리를 클론하여 사용하세요.
### 관련 링크
* [Beatrice V2 트레이닝 코드의 리포지토리](https://huggingface.co/fierce-cats/beatrice-trainer)
* [Beatrice V2 트레이닝 코드 Colab 버전](https://github.com/w-okada/beatrice-trainer-colab)
### 관련 소프트웨어
* [실시간 보이스 체인저 VCClient](https://github.com/w-okada/voice-changer)
* [읽기 소프트웨어 TTSClient](https://github.com/w-okada/ttsclient)
* [실시간 음성 인식 소프트웨어 ASRClient](https://github.com/w-okada/asrclient)
## VC Client의 특징
## 다양한 AI 모델을 지원
| AI 모델 | v.2 | v.1 | 라이선스 |
| ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
| [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | supported | supported | 리포지토리를 참조하세요. |
| [Beatrice v1](https://prj-beatrice.com/) | n/a | supported (only win) | [독자](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
| [Beatrice v2](https://prj-beatrice.com/) | supported | n/a | [독자](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
| [MMVC](https://github.com/isletennos/MMVC_Trainer) | n/a | supported | 리포지토리를 참조하세요. |
| [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | n/a | supported | 리포지토리를 참조하세요. |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | n/a | supported | 리포지토리를 참조하세요. |
## 독립형, 네트워크 경유의 두 가지 구성을 지원
로컬 PC에서 완료된 음성 변환과 네트워크를 통한 음성 변환을 지원합니다.
네트워크를 통해 사용하면 게임 등 고부하 애플리케이션과 동시에 사용할 때 음성 변환의 부하를 외부로 오프로드할 수 있습니다.
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
## 다중 플랫폼에 대응
Windows, Mac(M1), Linux, Google Colab
*1 Linux는 리포지토리를 클론하여 사용하세요.
## REST API를 제공
각종 프로그래밍 언어로 클라이언트를 만들 수 있습니다.
또한, curl 등 OS에 내장된 HTTP 클라이언트를 사용하여 조작할 수 있습니다.
## 문제 해결
[통신 편](tutorials/trouble_shoot_communication_ja.md)
## 개발자의 서명에 대해
이 소프트웨어는 개발자의 서명이 되어 있지 않습니다. 아래와 같은 경고가 나오지만, 컨트롤 키를 누른 상태에서 아이콘을 클릭하면 실행할 수 있습니다. 이는 Apple의 보안 정책에 따른 것입니다. 실행은 본인의 책임입니다.
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
## Acknowledgments
* [타치준다몬 소재](https://seiga.nicovideo.jp/seiga/im10792934)
* [일러스트야](https://www.irasutoya.com/)
* [츠쿠요미짱](https://tyc.rei-yumesaki.net/)
```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
■つくよみちゃんコーパスCV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
© Rei Yumesaki
```
* [아미타로의 목소리 소재 공방](https://amitaro.net/)
* [레플리카돌](https://kikyohiroto1227.wixsite.com/kikoto-utau)
## 이용 약관
* 실시간 보이스 체인저 츠쿠요미짱에 대해서는 츠쿠요미짱 코퍼스의 이용 약관에 따라 다음 목적에서 변환 후 음성을 사용하는 것을 금지합니다.
```
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
```
* 실시간 보이스 체인저 아미타로에 대해서는 아미타로の목소리 소재 공방의 다음 이용 약관에 따릅니다. 자세한 내용은[여기](https://amitaro.net/voice/faq/#index_id6)
```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
```
* 실시간 보이스 체인저 황금 마히로에 대해서는 레플리카돌의 이용 약관에 따릅니다. 자세한 내용은[여기](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
## 면책 조항
이 소프트웨어의 사용 또는 사용 불가으로 인해 발생한 어떠한 직접 손해, 간접 손해, 파급적 손해, 결과적 손해 또는 특별 손해에 대해서도 일체 책임을 지지 않습니다.

148
docs_i18n/README_la.md Normal file
View File

@ -0,0 +1,148 @@
[Lingua Iaponica](/README.md) /
[Lingua Anglica](/docs_i18n/README_en.md) /
[Lingua Coreana](/docs_i18n/README_ko.md)/
[Lingua Sinica](/docs_i18n/README_zh.md)/
[Lingua Theodisca](/docs_i18n/README_de.md)/
[Lingua Arabica](/docs_i18n/README_ar.md)/
[Lingua Graeca](/docs_i18n/README_el.md)/
[Lingua Hispanica](/docs_i18n/README_es.md)/
[Lingua Francogallica](/docs_i18n/README_fr.md)/
[Lingua Italica](/docs_i18n/README_it.md)/
[Lingua Latina](/docs_i18n/README_la.md)/
[Lingua Malaica](/docs_i18n/README_ms.md)/
[Lingua Russica](/docs_i18n/README_ru.md)
*Praeter linguam Iaponicam, omnes linguae sunt a machina translatae.
## VCClient
VCClient est software quod conversionem vocis in tempore reali per AI facit.
## What's New!
* v.2.0.78-beta
* bugfix: error sublationis RVC exemplaris vitata est
* Nunc simul cum versione 1.x incipere potes
* Auctae sunt chunk magnitudines eligibiles
* v.2.0.77-beta (solum pro RTX 5090, experimentale)
* Auxilium pro modulis RTX 5090 relatis (non verificatum quia auctor non habet RTX 5090)
* v.2.0.76-beta
* nova functio:
* Beatrice: Implementatio coniunctionis loquentium
* Beatrice: Automatica mutatio toni
* bugfix:
* Solutio problematum in delectu machinae in modo servientis
* v.2.0.73-beta
* nova functio:
* Download model Beatrice editum
* bugfix:
* Correctus error ubi pitch et formant Beatrice v2 non reflectuntur
* Correctus error ubi ONNX non potest fieri pro modelis utentibus embedder Applio
## Download et nexus pertinentes
Versiones pro Windows et M1 Mac possunt ex repositorio hugging face depromi.
* [Repositorium VCClient](https://huggingface.co/wok000/vcclient000/tree/main)
* [Repositorium Light VCClient pro Beatrice v2](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
*1 Linux utatur repositorio clone.
### Nexus pertinentes
* [Repositorium codicis disciplinae Beatrice V2](https://huggingface.co/fierce-cats/beatrice-trainer)
* [Codex disciplinae Beatrice V2 versio Colab](https://github.com/w-okada/beatrice-trainer-colab)
### Software pertinens
* [Mutator vocis in tempore reali VCClient](https://github.com/w-okada/voice-changer)
* [Software lectionis TTSClient](https://github.com/w-okada/ttsclient)
* [Software recognitionis vocis in tempore reali ASRClient](https://github.com/w-okada/asrclient)
## Proprietates VC Client
## Multa AI exempla sustinet
| Exempla AI | v.2 | v.1 | Licentia |
| ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
| [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | sustinetur | sustinetur | Vide repositorium. |
| [Beatrice v1](https://prj-beatrice.com/) | n/a | sustinetur (solum win) | [Proprium](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
| [Beatrice v2](https://prj-beatrice.com/) | sustinetur | n/a | [Proprium](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
| [MMVC](https://github.com/isletennos/MMVC_Trainer) | n/a | sustinetur | Vide repositorium. |
| [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | n/a | sustinetur | Vide repositorium. |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | n/a | sustinetur | Vide repositorium. |
## Sustinetur tam structura stand-alone quam per rete
Sustinetur conversio vocis in PC locali et per rete.
Per usum per rete, onus conversionis vocis potest externari cum simul cum applicationibus altis oneribus ut ludis adhibetur.
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
## Pluribus suggestis compatitur
Windows, Mac(M1), Linux, Google Colab
*1 Linux utatur repositorio clone.
## REST API praebet
Clientem creare potes in variis linguis programmandi.
Etiam per HTTP clientem in OS incorporatum ut curl operari potes.
## Solutio problematum
[De communicatione](tutorials/trouble_shoot_communication_ja.md)
## De signature auctoris
Hoc software non signatur auctore. Monitio ut infra apparebit, sed si iconem cum claviatura control premes, poteris exsequi. Hoc est secundum securitatem Apple. Exsecutio est tuae responsabilitatis.
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
## Gratias
* [Materia Tachi Zundamon](https://seiga.nicovideo.jp/seiga/im10792934)
* [Irasuto ya](https://www.irasutoya.com/)
* [Tsukuyomi-chan](https://tyc.rei-yumesaki.net/)
```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
■つくよみちゃんコーパスCV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
© Rei Yumesaki
```
* [Amitaro vox materiae officina](https://amitaro.net/)
* [Reprica doll](https://kikyohiroto1227.wixsite.com/kikoto-utau)
## Termini usus
* De mutatore vocis in tempore reali Tsukuyomi-chan, secundum Tsukuyomi-chan corpus usus, prohibetur usus vocis post conversionem ad sequentes fines.
```
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
```
* De mutatore vocis in tempore reali Amitaro, secundum Amitaro vox materiae officinae usus. Pro details[hic](https://amitaro.net/voice/faq/#index_id6)
```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
```
* De mutatore vocis in tempore reali Kogane Mahiro, secundum Reprica doll usus. Pro details[hic](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
## Disclaimer
Non tenemur pro ullis damnis directis, indirectis, consequentibus, vel specialibus ex usu vel incapacitate usus huius software.

148
docs_i18n/README_ms.md Normal file
View File

@ -0,0 +1,148 @@
[Bahasa Jepun](/README.md) /
[Bahasa Inggeris](/docs_i18n/README_en.md) /
[Bahasa Korea](/docs_i18n/README_ko.md)/
[Bahasa Cina](/docs_i18n/README_zh.md)/
[Bahasa Jerman](/docs_i18n/README_de.md)/
[Bahasa Arab](/docs_i18n/README_ar.md)/
[Bahasa Greek](/docs_i18n/README_el.md)/
[Bahasa Sepanyol](/docs_i18n/README_es.md)/
[Bahasa Perancis](/docs_i18n/README_fr.md)/
[Bahasa Itali](/docs_i18n/README_it.md)/
[Bahasa Latin](/docs_i18n/README_la.md)/
[Bahasa Melayu](/docs_i18n/README_ms.md)/
[Bahasa Rusia](/docs_i18n/README_ru.md)
*Selain bahasa Jepun, semua terjemahan adalah terjemahan mesin.
## VCClient
VCClient adalah perisian yang menggunakan AI untuk menukar suara secara masa nyata.
## What's New!
* v.2.0.78-beta
* pembaikan pepijat: Elakkan ralat muat naik model RVC
* Kini boleh dijalankan serentak dengan ver.1.x
* Saiz chunk yang boleh dipilih telah ditambah
* v.2.0.77-beta (hanya untuk RTX 5090, eksperimen)
* Sokongan untuk modul berkaitan RTX 5090 (tidak disahkan kerana pembangun tidak memiliki RTX 5090)
* v.2.0.76-beta
* ciri baru:
* Beatrice: Pelaksanaan penggabungan pembicara
* Beatrice: Auto pitch shift
* pembaikan pepijat:
* Menangani masalah pemilihan peranti dalam mod pelayan
* v.2.0.73-beta
* ciri baru:
* Muat turun model beatrice yang telah diedit
* pembaikan pepijat:
* Memperbaiki pepijat di mana pitch dan formant beatrice v2 tidak diterapkan
* Memperbaiki pepijat di mana ONNX tidak dapat dibuat untuk model yang menggunakan embedder Applio
## Muat Turun dan Pautan Berkaitan
Versi Windows dan M1 Mac boleh dimuat turun dari repositori hugging face.
* [Repositori VCClient](https://huggingface.co/wok000/vcclient000/tree/main)
* [Repositori Light VCClient untuk Beatrice v2](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
*1 Sila klon repositori untuk Linux.
### Pautan Berkaitan
* [Repositori Kod Latihan Beatrice V2](https://huggingface.co/fierce-cats/beatrice-trainer)
* [Versi Colab Kod Latihan Beatrice V2](https://github.com/w-okada/beatrice-trainer-colab)
### Perisian Berkaitan
* [Penukar Suara Masa Nyata VCClient](https://github.com/w-okada/voice-changer)
* [Perisian Pembacaan TTSClient](https://github.com/w-okada/ttsclient)
* [Perisian Pengecaman Suara Masa Nyata ASRClient](https://github.com/w-okada/asrclient)
## Ciri-ciri VC Client
## Menyokong pelbagai model AI
| Model AI | v.2 | v.1 | Lesen |
| ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
| [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | disokong | disokong | Sila rujuk repositori. |
| [Beatrice v1](https://prj-beatrice.com/) | n/a | disokong (hanya win) | [Khas](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
| [Beatrice v2](https://prj-beatrice.com/) | disokong | n/a | [Khas](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
| [MMVC](https://github.com/isletennos/MMVC_Trainer) | n/a | disokong | Sila rujuk repositori. |
| [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | n/a | disokong | Sila rujuk repositori. |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | n/a | disokong | Sila rujuk repositori. |
## Menyokong kedua-dua konfigurasi berdiri sendiri dan melalui rangkaian
Menyokong penukaran suara yang lengkap di PC tempatan dan juga melalui rangkaian.
Dengan menggunakan melalui rangkaian, beban penukaran suara boleh dialihkan ke luar apabila digunakan serentak dengan aplikasi yang memerlukan beban tinggi seperti permainan.
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
## Menyokong pelbagai platform
Windows, Mac(M1), Linux, Google Colab
*1 Sila klon repositori untuk Linux.
## Menyediakan REST API
Pelanggan boleh dibina dalam pelbagai bahasa pengaturcaraan.
Juga boleh dikendalikan menggunakan klien HTTP yang dibina dalam OS seperti curl.
## Penyelesaian Masalah
[Bahagian Komunikasi](tutorials/trouble_shoot_communication_ja.md)
## Mengenai Tandatangan Pembangun
Perisian ini tidak ditandatangani oleh pembangun. Amaran seperti di bawah akan muncul, tetapi anda boleh menjalankannya dengan menekan kekunci kawalan sambil mengklik ikon. Ini adalah disebabkan oleh dasar keselamatan Apple. Pelaksanaan adalah atas tanggungjawab sendiri.
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
## Penghargaan
* [Bahan Tachizundamon](https://seiga.nicovideo.jp/seiga/im10792934)
* [Irasutoya](https://www.irasutoya.com/)
* [Tsukuyomi-chan](https://tyc.rei-yumesaki.net/)
```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
■つくよみちゃんコーパスCV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
© Rei Yumesaki
```
* [Studio Bahan Suara Amitaro](https://amitaro.net/)
* [Replikadol](https://kikyohiroto1227.wixsite.com/kikoto-utau)
## Syarat Penggunaan
* Mengenai penukar suara masa nyata Tsukuyomi-chan, penggunaan suara yang ditukar untuk tujuan berikut adalah dilarang mengikut syarat penggunaan korpus Tsukuyomi-chan.
```
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
```
* Mengenai penukar suara masa nyata Amitaro, ia mematuhi syarat penggunaan Studio Bahan Suara Amitaro. Untuk maklumat lanjut, sila lihat[di sini](https://amitaro.net/voice/faq/#index_id6)
```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
```
* Mengenai penukar suara masa nyata Kogane Mahiro, ia mematuhi syarat penggunaan Replikadol. Untuk maklumat lanjut, sila lihat[di sini](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
## Penafian
Kami tidak bertanggungjawab ke atas sebarang kerosakan langsung, tidak langsung, berbangkit, akibat atau khas yang timbul daripada penggunaan atau ketidakupayaan untuk menggunakan perisian ini.

148
docs_i18n/README_ru.md Normal file
View File

@ -0,0 +1,148 @@
[японский](/README.md) /
[английский](/docs_i18n/README_en.md) /
[корейский](/docs_i18n/README_ko.md)/
[китайский](/docs_i18n/README_zh.md)/
[немецкий](/docs_i18n/README_de.md)/
[арабский](/docs_i18n/README_ar.md)/
[греческий](/docs_i18n/README_el.md)/
[испанский](/docs_i18n/README_es.md)/
[французский](/docs_i18n/README_fr.md)/
[итальянский](/docs_i18n/README_it.md)/
[латинский](/docs_i18n/README_la.md)/
[малайский](/docs_i18n/README_ms.md)/
[русский](/docs_i18n/README_ru.md)
*Кроме японского, все переводы выполнены машинным переводом.
## VCClient
VCClient — это программное обеспечение, использующее ИИ для преобразования голоса в реальном времени.
## Что нового!
* v.2.0.78-beta
* Исправление ошибки: предотвращена ошибка загрузки модели RVC
* Теперь возможно одновременное использование с версией 1.x
* Увеличено количество доступных размеров chunk
* v.2.0.77-beta (только для RTX 5090, экспериментальная)
* Поддержка модулей, связанных с RTX 5090 (не проверено, так как разработчик не имеет RTX 5090)
* v.2.0.76-beta
* новая функция:
* Beatrice: реализация слияния говорящих
* Beatrice: автоматический сдвиг тона
* исправление ошибок:
* Исправление ошибки при выборе устройства в серверном режиме
* v.2.0.73-beta
* новая функция:
* Загрузка отредактированной модели beatrice
* исправление ошибок:
* Исправлена ошибка, из-за которой pitch и formant в beatrice v2 не применялись
* Исправлена ошибка, из-за которой ONNX не создавался для моделей, использующих embedder Applio
## Загрузки и связанные ссылки
Версии для Windows и M1 Mac можно скачать из репозитория hugging face.
* [Репозиторий VCClient](https://huggingface.co/wok000/vcclient000/tree/main)
* [Репозиторий Light VCClient для Beatrice v2](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
*1 Для Linux клонируйте репозиторий.
### Связанные ссылки
* [Репозиторий кода обучения Beatrice V2](https://huggingface.co/fierce-cats/beatrice-trainer)
* [<EFBFBD><EFBFBD>од обучения Beatrice V2 для Colab](https://github.com/w-okada/beatrice-trainer-colab)
### Связанное программное обеспечение
* [Реалтайм голосовой преобразователь VCClient](https://github.com/w-okada/voice-changer)
* [Программное обеспечение для чтения текста TTSClient](https://github.com/w-okada/ttsclient)
* [Программное обеспечение для распознавания речи в реальном времени ASRClient](https://github.com/w-okada/asrclient)
## Особенности VC Client
## Поддержка различных моделей ИИ
| Модель ИИ | v.2 | v.1 | Лицензия |
| ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
| [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | поддерживается | поддерживается | См. репозиторий. |
| [Beatrice v1](https://prj-beatrice.com/) | n/a | поддерживается (только win) | [собственная](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
| [Beatrice v2](https://prj-beatrice.com/) | поддерживается | n/a | [собственная](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
| [MMVC](https://github.com/isletennos/MMVC_Trainer) | n/a | поддерживается | См. репозиторий. |
| [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | n/a | поддерживается | См. репозиторий. |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | n/a | поддерживается | См. репозиторий. |
## Поддержка как автономной, так и сетевой конфигурации
Поддерживается как локальное преобразование голоса на ПК, так и преобразование через сеть.
Использование через сеть позволяет разгрузить преобразование голоса на внешние ресурсы при одновременном использовании с ресурсоемкими приложениями, такими как игры.
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
## Поддержка нескольких платформ
Windows, Mac(M1), Linux, Google Colab
*1 Для Linux клонируйте репозиторий.
## Предоставление REST API
Можно создавать клиентов на различных языках программирования.
Также можно управлять с помощью встроенных в ОС HTTP-клиентов, таких как curl.
## Устранение неполадок
[Связь](tutorials/trouble_shoot_communication_ja.md)
## О подписи разработчика
Это программное обеспечение не подписано разработчиком. Появится предупреждение, как показано ниже, но вы можете запустить его, нажав на иконку, удерживая клавишу Control. Это связано с политикой безопасности Apple. Запуск осуществляется на ваш страх и риск.
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
## Благодарности
* [Материалы от Tachi Zundamon](https://seiga.nicovideo.jp/seiga/im10792934)
* [Иллюстрации](https://www.irasutoya.com/)
* [Tsukuyomi-chan](https://tyc.rei-yumesaki.net/)
```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
■つくよみちゃんコーパスCV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
© Rei Yumesaki
```
* [Голосовые материалы от Amitaro](https://amitaro.net/)
* [Replikador](https://kikyohiroto1227.wixsite.com/kikoto-utau)
## Условия использования
* Что касается реалтайм голосового преобразователя Tsukuyomi-chan, использование преобразованного голоса запрещено для следующих целей в соответствии с условиями использования корпуса Tsukuyomi-chan.
```
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
```
* Что касается реалтайм голосового преобразователя Amitaro, он подчиняется следующим условиям использования от Amitaro's Voice Material Workshop. Подробности[здесь](https://amitaro.net/voice/faq/#index_id6)
```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
```
* Что касается реалтайм голосового преобразователя Kogane Mahiro, он подчиняется условиям использования Replikador. Подробности[здесь](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
## Отказ от ответственности
Мы не несем ответственности за любые прямые, косвенные, побочные, косвенные или особые убытки, возникшие в результате использования или невозможности использования этого программного обеспечения.

148
docs_i18n/README_zh.md Normal file
View File

@ -0,0 +1,148 @@
[日语](/README.md) /
[英语](/docs_i18n/README_en.md) /
[韩语](/docs_i18n/README_ko.md)/
[中文](/docs_i18n/README_zh.md)/
[德语](/docs_i18n/README_de.md)/
[阿拉伯语](/docs_i18n/README_ar.md)/
[希腊语](/docs_i18n/README_el.md)/
[西班牙语](/docs_i18n/README_es.md)/
[法语](/docs_i18n/README_fr.md)/
[意大利语](/docs_i18n/README_it.md)/
[拉丁语](/docs_i18n/README_la.md)/
[马来语](/docs_i18n/README_ms.md)/
[俄语](/docs_i18n/README_ru.md)
*除日语外,其他语言均为机器翻译。
## VCClient
VCClient是一款利用AI进行实时语音转换的软件。
## What's New!
* v.2.0.78-beta
* bug修复避免RVC模型上传错误
* 现在可以与ver.1.x同时启动
* 增加了可选择的chunk size
* v.2.0.77-beta (仅适用于 RTX 5090实验性)
* 相关模块支持 RTX 5090由于开发者未拥有 RTX 5090未经验证
* v.2.0.76-beta
* 新功能:
* Beatrice: 实现说话者合并
* Beatrice: 自动音高转换
* 错误修复:
* 修复服务器模式下设备选择的问题
* v.2.0.73-beta
* 新功能:
* 下载编辑后的beatrice模型
* 错误修复:
* 修复了beatrice v2的音高和共振峰未反映的错误
* 修复了使用Applio的embedder的模型无法生成ONNX的错误
## 下载和相关链接
Windows版、M1 Mac版可以从hugging face的仓库下载。
* [VCClient 的仓库](https://huggingface.co/wok000/vcclient000/tree/main)
* [Light VCClient for Beatrice v2 的仓库](https://huggingface.co/wok000/light_vcclient_beatrice/tree/main)
*1 Linux请克隆仓库使用。
### 相关链接
* [Beatrice V2 训练代码的仓库](https://huggingface.co/fierce-cats/beatrice-trainer)
* [Beatrice V2 训练代码 Colab版](https://github.com/w-okada/beatrice-trainer-colab)
### 相关软件
* [实时变声器 VCClient](https://github.com/w-okada/voice-changer)
* [语音合成软件 TTSClient](https://github.com/w-okada/ttsclient)
* [实时语音识别软件 ASRClient](https://github.com/w-okada/asrclient)
## VC Client的特点
## 支持多种AI模型
| AI模型 | v.2 | v.1 | 许可证 |
| ------------------------------------------------------------------------------------------------------------ | --------- | -------------------- | ------------------------------------------------------------------------------------------ |
| [RVC ](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/README.ja.md) | supported | supported | 请参阅仓库。 |
| [Beatrice v1](https://prj-beatrice.com/) | n/a | supported (only win) | [独立](https://github.com/w-okada/voice-changer/tree/master/server/voice_changer/Beatrice) |
| [Beatrice v2](https://prj-beatrice.com/) | supported | n/a | [独立](https://huggingface.co/wok000/vcclient_model/blob/main/beatrice_v2_beta/readme.md) |
| [MMVC](https://github.com/isletennos/MMVC_Trainer) | n/a | supported | 请参阅仓库。 |
| [so-vits-svc](https://github.com/svc-develop-team/so-vits-svc) | n/a | supported | 请参阅仓库。 |
| [DDSP-SVC](https://github.com/yxlllc/DDSP-SVC) | n/a | supported | 请参阅仓库。 |
## 支持独立和通过网络的两种配置
支持在本地PC上完成的语音转换和通过网络的语音转换。
通过网络使用时,可以在与游戏等高负荷应用程序同时使用时将语音转换的负荷转移到外部。
![image](https://user-images.githubusercontent.com/48346627/206640768-53f6052d-0a96-403b-a06c-6714a0b7471d.png)
## 支持多平台
Windows, Mac(M1), Linux, Google Colab
*1 Linux请克隆仓库使用。
## 提供REST API
可以用各种编程语言创建客户端。
还可以使用curl等操作系统内置的HTTP客户端进行操作。
## 故障排除
[通信篇](tutorials/trouble_shoot_communication_ja.md)
## 关于开发者的签名
本软件未由开发者签名。虽然会出现如下警告但按住Control键并点击图标即可运行。这是由于Apple的安全策略所致。运行需自行承担风险。
![image](https://user-images.githubusercontent.com/48346627/212567711-c4a8d599-e24c-4fa3-8145-a5df7211f023.png)
## 致谢
* [立ちずんだもん素材](https://seiga.nicovideo.jp/seiga/im10792934)
* [いらすとや](https://www.irasutoya.com/)
* [つくよみちゃん](https://tyc.rei-yumesaki.net/)
```
本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
■つくよみちゃんコーパスCV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
© Rei Yumesaki
```
* [あみたろの声素材工房](https://amitaro.net/)
* [れぷりかどーる](https://kikyohiroto1227.wixsite.com/kikoto-utau)
## 使用条款
* 关于实时变声器つくよみちゃん,禁止将转换后的语音用于以下目的,遵循つくよみちゃん语料库的使用条款。
```
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
```
* 关于实时变声器あみたろ,遵循あみたろの声素材工房的以下使用条款。详情请见[这里](https://amitaro.net/voice/faq/#index_id6)
```
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。
ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
```
* 关于实时变声器黄琴まひろ,遵循れぷりかどーる的使用条款。详情请见[这里](https://kikyohiroto1227.wixsite.com/kikoto-utau/ter%EF%BD%8Ds-of-service)
## 免责声明
对于因使用或无法使用本软件而导致的任何直接、间接、衍生、结果性或特殊损害,本软件概不负责。

View File

@ -65,6 +65,9 @@ def setupArgParser():
parser.add_argument("--rmvpe", type=str, default="pretrain/rmvpe.pt", help="path to rmvpe") parser.add_argument("--rmvpe", type=str, default="pretrain/rmvpe.pt", help="path to rmvpe")
parser.add_argument("--rmvpe_onnx", type=str, default="pretrain/rmvpe.onnx", help="path to rmvpe onnx") parser.add_argument("--rmvpe_onnx", type=str, default="pretrain/rmvpe.onnx", help="path to rmvpe onnx")
parser.add_argument("--host", type=str, default='127.0.0.1', help="IP address of the network interface to listen for HTTP connections. Specify 0.0.0.0 to listen on all interfaces.")
parser.add_argument("--allowed-origins", action='append', default=[], help="List of URLs to allow connection from, i.e. https://example.com. Allows http(s)://127.0.0.1:{port} and http(s)://localhost:{port} by default.")
return parser return parser
@ -114,16 +117,19 @@ vcparams.setParams(voiceChangerParams)
printMessage(f"Booting PHASE :{__name__}", level=2) printMessage(f"Booting PHASE :{__name__}", level=2)
HOST = args.host
PORT = args.p PORT = args.p
def localServer(logLevel: str = "critical"): def localServer(logLevel: str = "critical", key_path: str | None = None, cert_path: str | None = None):
try: try:
uvicorn.run( uvicorn.run(
f"{os.path.basename(__file__)[:-3]}:app_socketio", f"{os.path.basename(__file__)[:-3]}:app_socketio",
host="0.0.0.0", host=HOST,
port=int(PORT), port=int(PORT),
reload=False if hasattr(sys, "_MEIPASS") else True, reload=False if hasattr(sys, "_MEIPASS") else True,
ssl_keyfile=key_path,
ssl_certfile=cert_path,
log_level=logLevel, log_level=logLevel,
) )
except Exception as e: except Exception as e:
@ -134,8 +140,8 @@ if __name__ == "MMVCServerSIO":
mp.freeze_support() mp.freeze_support()
voiceChangerManager = VoiceChangerManager.get_instance(voiceChangerParams) voiceChangerManager = VoiceChangerManager.get_instance(voiceChangerParams)
app_fastapi = MMVC_Rest.get_instance(voiceChangerManager, voiceChangerParams) app_fastapi = MMVC_Rest.get_instance(voiceChangerManager, voiceChangerParams, args.allowed_origins, PORT)
app_socketio = MMVC_SocketIOApp.get_instance(app_fastapi, voiceChangerManager) app_socketio = MMVC_SocketIOApp.get_instance(app_fastapi, voiceChangerManager, args.allowed_origins, PORT)
if __name__ == "__mp_main__": if __name__ == "__mp_main__":
@ -220,34 +226,26 @@ if __name__ == "__main__":
printMessage("In many cases, it will launch when you access any of the following URLs.", level=2) printMessage("In many cases, it will launch when you access any of the following URLs.", level=2)
if "EX_PORT" in locals() and "EX_IP" in locals(): # シェルスクリプト経由起動(docker) if "EX_PORT" in locals() and "EX_IP" in locals(): # シェルスクリプト経由起動(docker)
if args.https == 1: if args.https == 1:
printMessage(f"https://127.0.0.1:{EX_PORT}/", level=1) printMessage(f"https://localhost:{EX_PORT}/", level=1)
for ip in EX_IP.strip().split(" "): for ip in EX_IP.strip().split(" "):
printMessage(f"https://{ip}:{EX_PORT}/", level=1) printMessage(f"https://{ip}:{EX_PORT}/", level=1)
else: else:
printMessage(f"http://127.0.0.1:{EX_PORT}/", level=1) printMessage(f"http://localhost:{EX_PORT}/", level=1)
else: # 直接python起動 else: # 直接python起動
if args.https == 1: if args.https == 1:
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM) s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
s.connect((args.test_connect, 80)) s.connect((args.test_connect, 80))
hostname = s.getsockname()[0] hostname = s.getsockname()[0]
printMessage(f"https://127.0.0.1:{PORT}/", level=1) printMessage(f"https://localhost:{PORT}/", level=1)
printMessage(f"https://{hostname}:{PORT}/", level=1) printMessage(f"https://{hostname}:{PORT}/", level=1)
else: else:
printMessage(f"http://127.0.0.1:{PORT}/", level=1) printMessage(f"http://localhost:{PORT}/", level=1)
# サーバ起動 # サーバ起動
if args.https: if args.https:
# HTTPS サーバ起動 # HTTPS サーバ起動
try: try:
uvicorn.run( localServer(args.logLevel, key_path, cert_path)
f"{os.path.basename(__file__)[:-3]}:app_socketio",
host="0.0.0.0",
port=int(PORT),
reload=False if hasattr(sys, "_MEIPASS") else True,
ssl_keyfile=key_path,
ssl_certfile=cert_path,
log_level=args.logLevel,
)
except Exception as e: except Exception as e:
logger.error(f"[Voice Changer] Web Server(https) Launch Exception, {e}") logger.error(f"[Voice Changer] Web Server(https) Launch Exception, {e}")
@ -256,12 +254,12 @@ if __name__ == "__main__":
p.start() p.start()
try: try:
if sys.platform.startswith("win"): if sys.platform.startswith("win"):
process = subprocess.Popen([NATIVE_CLIENT_FILE_WIN, "--disable-gpu", "-u", f"http://127.0.0.1:{PORT}/"]) process = subprocess.Popen([NATIVE_CLIENT_FILE_WIN, "--disable-gpu", "-u", f"http://localhost:{PORT}/"])
return_code = process.wait() return_code = process.wait()
logger.info("client closed.") logger.info("client closed.")
p.terminate() p.terminate()
elif sys.platform.startswith("darwin"): elif sys.platform.startswith("darwin"):
process = subprocess.Popen([NATIVE_CLIENT_FILE_MAC, "--disable-gpu", "-u", f"http://127.0.0.1:{PORT}/"]) process = subprocess.Popen([NATIVE_CLIENT_FILE_MAC, "--disable-gpu", "-u", f"http://localhost:{PORT}/"])
return_code = process.wait() return_code = process.wait()
logger.info("client closed.") logger.info("client closed.")
p.terminate() p.terminate()

24
server/mods/origins.py Normal file
View File

@ -0,0 +1,24 @@
from typing import Optional, Sequence
from urllib.parse import urlparse
ENFORCE_URL_ORIGIN_FORMAT = "Input origins must be well-formed URLs, i.e. https://google.com or https://www.google.com."
SCHEMAS = ('http', 'https')
LOCAL_ORIGINS = ('127.0.0.1', 'localhost')
def compute_local_origins(port: Optional[int] = None) -> list[str]:
local_origins = [f'{schema}://{origin}' for schema in SCHEMAS for origin in LOCAL_ORIGINS]
if port is not None:
local_origins = [f'{origin}:{port}' for origin in local_origins]
return local_origins
def normalize_origins(origins: Sequence[str]) -> set[str]:
allowed_origins = set()
for origin in origins:
url = urlparse(origin)
assert url.scheme, ENFORCE_URL_ORIGIN_FORMAT
valid_origin = f'{url.scheme}://{url.hostname}'
if url.port:
valid_origin += f':{url.port}'
allowed_origins.add(valid_origin)
return allowed_origins

View File

@ -1,12 +1,12 @@
import os import os
import sys import sys
from restapi.mods.trustedorigin import TrustedOriginMiddleware
from fastapi import FastAPI, Request, Response, HTTPException from fastapi import FastAPI, Request, Response, HTTPException
from fastapi.routing import APIRoute from fastapi.routing import APIRoute
from fastapi.middleware.cors import CORSMiddleware
from fastapi.staticfiles import StaticFiles from fastapi.staticfiles import StaticFiles
from fastapi.exceptions import RequestValidationError from fastapi.exceptions import RequestValidationError
from typing import Callable from typing import Callable, Optional, Sequence, Literal
from mods.log_control import VoiceChangaerLogger from mods.log_control import VoiceChangaerLogger
from voice_changer.VoiceChangerManager import VoiceChangerManager from voice_changer.VoiceChangerManager import VoiceChangerManager
@ -43,17 +43,17 @@ class MMVC_Rest:
cls, cls,
voiceChangerManager: VoiceChangerManager, voiceChangerManager: VoiceChangerManager,
voiceChangerParams: VoiceChangerParams, voiceChangerParams: VoiceChangerParams,
allowedOrigins: Optional[Sequence[str]] = None,
port: Optional[int] = None,
): ):
if cls._instance is None: if cls._instance is None:
logger.info("[Voice Changer] MMVC_Rest initializing...") logger.info("[Voice Changer] MMVC_Rest initializing...")
app_fastapi = FastAPI() app_fastapi = FastAPI()
app_fastapi.router.route_class = ValidationErrorLoggingRoute app_fastapi.router.route_class = ValidationErrorLoggingRoute
app_fastapi.add_middleware( app_fastapi.add_middleware(
CORSMiddleware, TrustedOriginMiddleware,
allow_origins=["*"], allowed_origins=allowedOrigins,
allow_credentials=True, port=port
allow_methods=["*"],
allow_headers=["*"],
) )
app_fastapi.mount( app_fastapi.mount(

View File

@ -0,0 +1,43 @@
from typing import Optional, Sequence, Literal
from mods.origins import compute_local_origins, normalize_origins
from starlette.datastructures import Headers
from starlette.responses import PlainTextResponse
from starlette.types import ASGIApp, Receive, Scope, Send
class TrustedOriginMiddleware:
def __init__(
self,
app: ASGIApp,
allowed_origins: Optional[Sequence[str]] = None,
port: Optional[int] = None,
) -> None:
self.allowed_origins: set[str] = set()
local_origins = compute_local_origins(port)
self.allowed_origins.update(local_origins)
if allowed_origins is not None:
normalized_origins = normalize_origins(allowed_origins)
self.allowed_origins.update(normalized_origins)
self.app = app
async def __call__(self, scope: Scope, receive: Receive, send: Send) -> None:
if scope["type"] not in (
"http",
"websocket",
): # pragma: no cover
await self.app(scope, receive, send)
return
headers = Headers(scope=scope)
origin = headers.get("origin", "")
# Origin header is not present for same origin
if not origin or origin in self.allowed_origins:
await self.app(scope, receive, send)
return
response = PlainTextResponse("Invalid origin header", status_code=400)
await response(scope, receive, send)

View File

@ -1,6 +1,8 @@
import socketio import socketio
from mods.log_control import VoiceChangaerLogger from mods.log_control import VoiceChangaerLogger
from mods.origins import compute_local_origins, normalize_origins
from typing import Sequence, Optional
from sio.MMVC_SocketIOServer import MMVC_SocketIOServer from sio.MMVC_SocketIOServer import MMVC_SocketIOServer
from voice_changer.VoiceChangerManager import VoiceChangerManager from voice_changer.VoiceChangerManager import VoiceChangerManager
from const import getFrontendPath from const import getFrontendPath
@ -12,10 +14,24 @@ class MMVC_SocketIOApp:
_instance: socketio.ASGIApp | None = None _instance: socketio.ASGIApp | None = None
@classmethod @classmethod
def get_instance(cls, app_fastapi, voiceChangerManager: VoiceChangerManager): def get_instance(
cls,
app_fastapi,
voiceChangerManager: VoiceChangerManager,
allowedOrigins: Optional[Sequence[str]] = None,
port: Optional[int] = None,
):
if cls._instance is None: if cls._instance is None:
logger.info("[Voice Changer] MMVC_SocketIOApp initializing...") logger.info("[Voice Changer] MMVC_SocketIOApp initializing...")
sio = MMVC_SocketIOServer.get_instance(voiceChangerManager)
allowed_origins: set[str] = set()
local_origins = compute_local_origins(port)
allowed_origins.update(local_origins)
if allowedOrigins is not None:
normalized_origins = normalize_origins(allowedOrigins)
allowed_origins.update(normalized_origins)
sio = MMVC_SocketIOServer.get_instance(voiceChangerManager, list(allowed_origins))
app_socketio = socketio.ASGIApp( app_socketio = socketio.ASGIApp(
sio, sio,
other_asgi_app=app_fastapi, other_asgi_app=app_fastapi,

View File

@ -8,9 +8,13 @@ class MMVC_SocketIOServer:
_instance: socketio.AsyncServer | None = None _instance: socketio.AsyncServer | None = None
@classmethod @classmethod
def get_instance(cls, voiceChangerManager: VoiceChangerManager): def get_instance(
cls,
voiceChangerManager: VoiceChangerManager,
allowedOrigins: list[str],
):
if cls._instance is None: if cls._instance is None:
sio = socketio.AsyncServer(async_mode="asgi", cors_allowed_origins="*") sio = socketio.AsyncServer(async_mode="asgi", cors_allowed_origins=allowedOrigins)
namespace = MMVC_Namespace.get_instance(voiceChangerManager) namespace = MMVC_Namespace.get_instance(voiceChangerManager)
sio.register_namespace(namespace) sio.register_namespace(namespace)
cls._instance = sio cls._instance = sio

View File

@ -119,6 +119,62 @@
"created_at": "2024-02-29T02:04:59Z", "created_at": "2024-02-29T02:04:59Z",
"repoId": 527419347, "repoId": 527419347,
"pullRequestNo": 1137 "pullRequestNo": 1137
},
{
"name": "deiteris",
"id": 6103913,
"comment_id": 2002160613,
"created_at": "2024-03-16T22:24:35Z",
"repoId": 527419347,
"pullRequestNo": 1153
},
{
"name": "mrs1669",
"id": 40351476,
"comment_id": 2036836572,
"created_at": "2024-04-04T10:52:11Z",
"repoId": 527419347,
"pullRequestNo": 1171
},
{
"name": "mrs1669",
"id": 40351476,
"comment_id": 2036838458,
"created_at": "2024-04-04T10:53:14Z",
"repoId": 527419347,
"pullRequestNo": 1171
},
{
"name": "vitaliylag",
"id": 12641771,
"comment_id": 2143259823,
"created_at": "2024-06-01T03:13:56Z",
"repoId": 527419347,
"pullRequestNo": 1224
},
{
"name": "Nick088Official",
"id": 91847579,
"comment_id": 2170165841,
"created_at": "2024-06-15T16:27:32Z",
"repoId": 527419347,
"pullRequestNo": 1241
},
{
"name": "QweRezOn",
"id": 131252058,
"comment_id": 2349461674,
"created_at": "2024-09-13T17:04:41Z",
"repoId": 527419347,
"pullRequestNo": 1347
},
{
"name": "mallocfree009",
"id": 211442169,
"comment_id": 2888281620,
"created_at": "2025-05-17T10:31:47Z",
"repoId": 527419347,
"pullRequestNo": 1504
} }
] ]
} }