wokada-voice-changer/client/lib/src/const.ts


// (★1) chunk sizeは 128サンプル, 256byte(int16)と定義。
// (★2) 256byte(最低バッファサイズ256から間引いた個数x2byte)をchunkとして管理。
// 24000sample -> 1sec, 128sample(1chunk) -> 5.333msec
// 187.5chunk -> 1sec

///////////////////////
// サーバセッティング
///////////////////////
export const InputSampleRate = {
    "48000": 48000,
    "24000": 24000
} as const
export type InputSampleRate = typeof InputSampleRate[keyof typeof InputSampleRate]

export const CrossFadeOverlapSize = {
    "1024": 1024,
    "2048": 2048,
    "4096": 4096,
} as const
export type CrossFadeOverlapSize = typeof CrossFadeOverlapSize[keyof typeof CrossFadeOverlapSize]


export const OnnxExecutionProvider = {
    "CPUExecutionProvider": "CPUExecutionProvider",
    "CUDAExecutionProvider": "CUDAExecutionProvider",
    "DmlExecutionProvider": "DmlExecutionProvider",
    "OpenVINOExecutionProvider": "OpenVINOExecutionProvider",
} as const
export type OnnxExecutionProvider = typeof OnnxExecutionProvider[keyof typeof OnnxExecutionProvider]

export const Framework = {
    "PyTorch": "PyTorch",
    "ONNX": "ONNX",
} as const
export type Framework = typeof Framework[keyof typeof Framework]

export const F0Detector = {
    "dio": "dio",
    "harvest": "harvest",
} as const
export type F0Detector = typeof F0Detector[keyof typeof F0Detector]


export const ServerSettingKey = {
    "srcId": "srcId",
    "dstId": "dstId",
    "gpu": "gpu",

    "crossFadeOffsetRate": "crossFadeOffsetRate",
    "crossFadeEndRate": "crossFadeEndRate",
    "crossFadeOverlapSize": "crossFadeOverlapSize",

    "framework": "framework",
    "onnxExecutionProvider": "onnxExecutionProvider",

    "f0Factor": "f0Factor",
    "f0Detector": "f0Detector",
    "recordIO": "recordIO",

    "inputSampleRate": "inputSampleRate",
} as const
export type ServerSettingKey = typeof ServerSettingKey[keyof typeof ServerSettingKey]


export type VoiceChangerServerSetting = {
    srcId: number,
    dstId: number,
    gpu: number,

    crossFadeOffsetRate: number,
    crossFadeEndRate: number,
    crossFadeOverlapSize: CrossFadeOverlapSize,

    framework: Framework
    onnxExecutionProvider: OnnxExecutionProvider,

    f0Factor: number
    f0Detector: F0Detector // dio or harvest
    recordIO: number // 0:off, 1:on

    inputSampleRate: InputSampleRate
}

export type ServerInfo = VoiceChangerServerSetting & {
    status: string
    configFile: string,
    pyTorchModelFile: string,
    onnxModelFile: string,
    onnxExecutionProviders: OnnxExecutionProvider[]
}

export const DefaultServerSetting: ServerInfo = {
    srcId: 0,
    dstId: 101,
    gpu: 0,

    crossFadeOffsetRate: 0.1,
    crossFadeEndRate: 0.9,
    crossFadeOverlapSize: CrossFadeOverlapSize[4096],

    framework: Framework.PyTorch,
    f0Factor: 1.0,
    onnxExecutionProvider: OnnxExecutionProvider.CPUExecutionProvider,
    f0Detector: F0Detector.dio,
    recordIO: 0,

    inputSampleRate: 48000,

    // 
    status: "ok",
    configFile: "",
    pyTorchModelFile: "",
    onnxModelFile: "",
    onnxExecutionProviders: []
}


///////////////////////
// Workletセッティング
///////////////////////

///////////////////////
// Clientセッティング
///////////////////////


export type VoiceChangerClientSetting = {
    audioInput: string | MediaStream | null,
    mmvcServerUrl: string,
    protocol: Protocol,
    sampleRate: SampleRate, // 48000Hz
    sendingSampleRate: SendingSampleRate,
    bufferSize: BufferSize, // 256, 512, 1024, 2048, 4096, 8192, 16384 (for mic stream)
    inputChunkNum: number, // n of (256 x n) for send buffer
    speakers: Speaker[],
    correspondences: Correspondence[],
    echoCancel: boolean,
    noiseSuppression: boolean,
    noiseSuppression2: boolean,
    voiceChangerMode: VoiceChangerMode,
    downSamplingMode: DownSamplingMode,

    inputGain: number
    outputGain: number
}

export type WorkletSetting = {
    numTrancateTreshold: number,
    volTrancateThreshold: number,
    volTrancateLength: number
}

export type Speaker = {
    "id": number,
    "name": string,
}
export type Correspondence = {
    "sid": number,
    "correspondence": number,
    "dirname": string
}


export type ServerAudioDevice = {
    kind: string,
    index: number,
    name: string,
    hostAPI: string
}

export type ServerAudioDevices = {
    audio_input_devices: ServerAudioDevice[]
    audio_output_devices: ServerAudioDevice[]
}


// Consts
export const Protocol = {
    "sio": "sio",
    "rest": "rest",
} as const
export type Protocol = typeof Protocol[keyof typeof Protocol]

export const VoiceChangerMode = {
    "realtime": "realtime",
    "near-realtime": "near-realtime",
} as const
export type VoiceChangerMode = typeof VoiceChangerMode[keyof typeof VoiceChangerMode]

export const DownSamplingMode = {
    "decimate": "decimate",
    "average": "average"
} as const
export type DownSamplingMode = typeof DownSamplingMode[keyof typeof DownSamplingMode]

export const SampleRate = {
    "48000": 48000,
} as const
export type SampleRate = typeof SampleRate[keyof typeof SampleRate]

export const SendingSampleRate = {
    "48000": 48000,
    "24000": 24000
} as const
export type SendingSampleRate = typeof SendingSampleRate[keyof typeof SendingSampleRate]

export const BufferSize = {
    "256": 256,
    "512": 512,
    "1024": 1024,
    "2048": 2048,
    "4096": 4096,
    "8192": 8192,
    "16384": 16384
} as const
export type BufferSize = typeof BufferSize[keyof typeof BufferSize]

// Defaults


export const DefaultVoiceChangerClientSetting: VoiceChangerClientSetting = {
    audioInput: null,
    mmvcServerUrl: "",
    protocol: "sio",
    sampleRate: 48000,
    sendingSampleRate: 48000,
    bufferSize: 1024,
    inputChunkNum: 48,
    speakers: [
        {
            "id": 0,
            "name": "user"
        },
        {
            "id": 101,
            "name": "ずんだもん"
        },
        {
            "id": 102,
            "name": "そら"
        },
        {
            "id": 103,
            "name": "めたん"
        },
        {
            "id": 104,
            "name": "つむぎ"
        }
    ],
    correspondences: [],
    echoCancel: true,
    noiseSuppression: true,
    noiseSuppression2: false,
    voiceChangerMode: "realtime",
    downSamplingMode: "average",
    inputGain: 1.0,
    outputGain: 1.0
}

export const DefaultWorkletSetting: WorkletSetting = {
    numTrancateTreshold: 188,
    volTrancateThreshold: 0.0005,
    volTrancateLength: 32
}

export const VOICE_CHANGER_CLIENT_EXCEPTION = {
    ERR_SIO_CONNECT_FAILED: "ERR_SIO_CONNECT_FAILED",
    ERR_SIO_INVALID_RESPONSE: "ERR_SIO_INVALID_RESPONSE",
    ERR_REST_INVALID_RESPONSE: "ERR_REST_INVALID_RESPONSE",
    ERR_MIC_STREAM_NOT_INITIALIZED: "ERR_MIC_STREAM_NOT_INITIALIZED"

} as const
export type VOICE_CHANGER_CLIENT_EXCEPTION = typeof VOICE_CHANGER_CLIENT_EXCEPTION[keyof typeof VOICE_CHANGER_CLIENT_EXCEPTION]


////////////////////////////////////
// indexedDB
////////////////////////////////////
export const INDEXEDDB_DB_APP_NAME = "INDEXEDDB_KEY_VOICE_CHANGER"
export const INDEXEDDB_DB_NAME = "INDEXEDDB_KEY_VOICE_CHANGER_DB"
export const INDEXEDDB_KEY_CLIENT = "INDEXEDDB_KEY_VOICE_CHANGER_LIB_CLIENT"
export const INDEXEDDB_KEY_SERVER = "INDEXEDDB_KEY_VOICE_CHANGER_LIB_SERVER"
export const INDEXEDDB_KEY_MODEL_DATA = "INDEXEDDB_KEY_VOICE_CHANGER_LIB_MODEL_DATA"
export const INDEXEDDB_KEY_WORKLET = "INDEXEDDB_KEY_VOICE_CHANGER_LIB_WORKLET"
WIP:client work v000 2023-01-05 02:28:36 +09:00
			`// (★1) chunk sizeは 128サンプル, 256byte(int16)と定義。`
			`// (★2) 256byte(最低バッファサイズ256から間引いた個数x2byte)をchunkとして管理。`
WIPsilent skip 2023-01-12 03:49:22 +09:00			`// 24000sample -> 1sec, 128sample(1chunk) -> 5.333msec`
worklet setting 2023-01-12 04:52:01 +09:00			`// 187.5chunk -> 1sec`
WIP:client work v000 2023-01-05 02:28:36 +09:00
WIP: refactoring, passthru server config 2023-02-19 10:12:25 +09:00			`///////////////////////`
			`// サーバセッティング`
			`///////////////////////`
			`export const InputSampleRate = {`
			`"48000": 48000,`
			`"24000": 24000`
			`} as const`
			`export type InputSampleRate = typeof InputSampleRate[keyof typeof InputSampleRate]`

			`export const CrossFadeOverlapSize = {`
			`"1024": 1024,`
			`"2048": 2048,`
			`"4096": 4096,`
			`} as const`
			`export type CrossFadeOverlapSize = typeof CrossFadeOverlapSize[keyof typeof CrossFadeOverlapSize]`
add downsampling mode 2023-02-14 22:32:25 +09:00
WIP: refactoring, change overlaprate to overlapsize 2023-02-19 06:25:22 +09:00
WIP: refactoring, passthru server config 2023-02-19 10:12:25 +09:00			`export const OnnxExecutionProvider = {`
			`"CPUExecutionProvider": "CPUExecutionProvider",`
			`"CUDAExecutionProvider": "CUDAExecutionProvider",`
			`"DmlExecutionProvider": "DmlExecutionProvider",`
			`"OpenVINOExecutionProvider": "OpenVINOExecutionProvider",`
			`} as const`
			`export type OnnxExecutionProvider = typeof OnnxExecutionProvider[keyof typeof OnnxExecutionProvider]`

			`export const Framework = {`
			`"PyTorch": "PyTorch",`
			`"ONNX": "ONNX",`
			`} as const`
			`export type Framework = typeof Framework[keyof typeof Framework]`

			`export const F0Detector = {`
			`"dio": "dio",`
			`"harvest": "harvest",`
			`} as const`
			`export type F0Detector = typeof F0Detector[keyof typeof F0Detector]`



			`export const ServerSettingKey = {`
			`"srcId": "srcId",`
			`"dstId": "dstId",`
			`"gpu": "gpu",`
add minimum convert size 2023-01-12 21:42:02 +09:00
WIP: refactoring, passthru server config 2023-02-19 10:12:25 +09:00			`"crossFadeOffsetRate": "crossFadeOffsetRate",`
			`"crossFadeEndRate": "crossFadeEndRate",`
			`"crossFadeOverlapSize": "crossFadeOverlapSize",`

			`"framework": "framework",`
			`"onnxExecutionProvider": "onnxExecutionProvider",`

			`"f0Factor": "f0Factor",`
			`"f0Detector": "f0Detector",`
			`"recordIO": "recordIO",`

			`"inputSampleRate": "inputSampleRate",`
			`} as const`
			`export type ServerSettingKey = typeof ServerSettingKey[keyof typeof ServerSettingKey]`


			`export type VoiceChangerServerSetting = {`
WIP:client work v000 2023-01-05 02:28:36 +09:00			`srcId: number,`
			`dstId: number,`
			`gpu: number,`

			`crossFadeOffsetRate: number,`
			`crossFadeEndRate: number,`
WIP: refactoring, passthru server config 2023-02-19 10:12:25 +09:00			`crossFadeOverlapSize: CrossFadeOverlapSize,`
WIP refactoring 2023-01-07 20:07:39 +09:00
refactoring hooks 2023-01-12 16:38:45 +09:00			`framework: Framework`
			`onnxExecutionProvider: OnnxExecutionProvider,`
WIP: docker support v1.5.x trial 5 2023-02-11 00:59:44 +09:00
			`f0Factor: number`
WIP: refactoring, passthru server config 2023-02-19 10:12:25 +09:00			`f0Detector: F0Detector // dio or harvest`
add quality control 2023-02-15 05:02:51 +09:00			`recordIO: number // 0:off, 1:on`
WIP: refactoring, passthru server config 2023-02-19 10:12:25 +09:00
server resampling added 2023-02-18 20:53:15 +09:00			`inputSampleRate: InputSampleRate`
WIP:client work v000 2023-01-05 02:28:36 +09:00			`}`

WIP: refactoring, passthru server config 2023-02-19 10:12:25 +09:00			`export type ServerInfo = VoiceChangerServerSetting & {`
			`status: string`
			`configFile: string,`
			`pyTorchModelFile: string,`
			`onnxModelFile: string,`
			`onnxExecutionProviders: OnnxExecutionProvider[]`
			`}`

			`export const DefaultServerSetting: ServerInfo = {`
			`srcId: 0,`
			`dstId: 101,`
			`gpu: 0,`

			`crossFadeOffsetRate: 0.1,`
			`crossFadeEndRate: 0.9,`
			`crossFadeOverlapSize: CrossFadeOverlapSize[4096],`

			`framework: Framework.PyTorch,`
			`f0Factor: 1.0,`
			`onnxExecutionProvider: OnnxExecutionProvider.CPUExecutionProvider,`
			`f0Detector: F0Detector.dio,`
			`recordIO: 0,`

			`inputSampleRate: 48000,`

			`//`
			`status: "ok",`
			`configFile: "",`
			`pyTorchModelFile: "",`
			`onnxModelFile: "",`
			`onnxExecutionProviders: []`
			`}`


			`///////////////////////`
			`// Workletセッティング`
			`///////////////////////`

			`///////////////////////`
			`// Clientセッティング`
			`///////////////////////`


refactoring hooks 2023-01-12 16:38:45 +09:00			`export type VoiceChangerClientSetting = {`
gpu update 2023-01-05 18:35:56 +09:00			`audioInput: string \| MediaStream \| null,`
WIP:client work v000 2023-01-05 02:28:36 +09:00			`mmvcServerUrl: string,`
tuning 2023-01-05 11:45:42 +09:00			`protocol: Protocol,`
WIP:client work v000 2023-01-05 02:28:36 +09:00			`sampleRate: SampleRate, // 48000Hz`
server resampling added 2023-02-18 20:53:15 +09:00			`sendingSampleRate: SendingSampleRate,`
WIP:client work v000 2023-01-05 02:28:36 +09:00			`bufferSize: BufferSize, // 256, 512, 1024, 2048, 4096, 8192, 16384 (for mic stream)`
tuning 2023-01-05 11:45:42 +09:00			`inputChunkNum: number, // n of (256 x n) for send buffer`
WIP:client work v000 2023-01-05 02:28:36 +09:00			`speakers: Speaker[],`
WIP: support v1.5.x, improve quality 1 2023-02-12 12:25:57 +09:00			`correspondences: Correspondence[],`
add quality control 2023-02-15 05:02:51 +09:00			`echoCancel: boolean,`
			`noiseSuppression: boolean,`
			`noiseSuppression2: boolean,`
WIP:client work v000 2023-01-05 02:28:36 +09:00			`voiceChangerMode: VoiceChangerMode,`
add downsampling mode 2023-02-14 22:32:25 +09:00			`downSamplingMode: DownSamplingMode,`
add gain control 2023-02-12 18:19:22 +09:00
			`inputGain: number`
			`outputGain: number`
WIP:client work v000 2023-01-05 02:28:36 +09:00			`}`

worklet setting 2023-01-12 04:52:01 +09:00			`export type WorkletSetting = {`
			`numTrancateTreshold: number,`
			`volTrancateThreshold: number,`
			`volTrancateLength: number`
			`}`
WIP:client work v000 2023-01-05 02:28:36 +09:00
			`export type Speaker = {`
			`"id": number,`
			`"name": string,`
			`}`
WIP: support v1.5.x, improve quality 1 2023-02-12 12:25:57 +09:00			`export type Correspondence = {`
			`"sid": number,`
			`"correspondence": number,`
			`"dirname": string`
			`}`
WIP:client work v000 2023-01-05 02:28:36 +09:00
gui temp 2023-01-08 16:18:20 +09:00
WIP: local mic 2023-02-18 04:15:34 +09:00			`export type ServerAudioDevice = {`
			`kind: string,`
			`index: number,`
			`name: string,`
			`hostAPI: string`
			`}`
sync status to server 2023-01-11 02:19:54 +09:00
WIP: local mic 2023-02-18 04:15:34 +09:00			`export type ServerAudioDevices = {`
			`audio_input_devices: ServerAudioDevice[]`
			`audio_output_devices: ServerAudioDevice[]`
			`}`
sync status to server 2023-01-11 02:19:54 +09:00


WIP:client work v000 2023-01-05 02:28:36 +09:00			`// Consts`
tuning 2023-01-05 11:45:42 +09:00			`export const Protocol = {`
WIP:client work v000 2023-01-05 02:28:36 +09:00			`"sio": "sio",`
			`"rest": "rest",`
			`} as const`
tuning 2023-01-05 11:45:42 +09:00			`export type Protocol = typeof Protocol[keyof typeof Protocol]`
WIP:client work v000 2023-01-05 02:28:36 +09:00
			`export const VoiceChangerMode = {`
			`"realtime": "realtime",`
			`"near-realtime": "near-realtime",`
			`} as const`
			`export type VoiceChangerMode = typeof VoiceChangerMode[keyof typeof VoiceChangerMode]`

add downsampling mode 2023-02-14 22:32:25 +09:00			`export const DownSamplingMode = {`
			`"decimate": "decimate",`
			`"average": "average"`
			`} as const`
			`export type DownSamplingMode = typeof DownSamplingMode[keyof typeof DownSamplingMode]`

WIP:client work v000 2023-01-05 02:28:36 +09:00			`export const SampleRate = {`
			`"48000": 48000,`
			`} as const`
			`export type SampleRate = typeof SampleRate[keyof typeof SampleRate]`

server resampling added 2023-02-18 20:53:15 +09:00			`export const SendingSampleRate = {`
			`"48000": 48000,`
			`"24000": 24000`
			`} as const`
			`export type SendingSampleRate = typeof SendingSampleRate[keyof typeof SendingSampleRate]`

WIP:client work v000 2023-01-05 02:28:36 +09:00			`export const BufferSize = {`
tuning 2023-01-05 11:45:42 +09:00			`"256": 256,`
			`"512": 512,`
WIP:client work v000 2023-01-05 02:28:36 +09:00			`"1024": 1024,`
tuning 2023-01-05 11:45:42 +09:00			`"2048": 2048,`
			`"4096": 4096,`
			`"8192": 8192,`
			`"16384": 16384`
WIP:client work v000 2023-01-05 02:28:36 +09:00			`} as const`
			`export type BufferSize = typeof BufferSize[keyof typeof BufferSize]`

			`// Defaults`
WIP: refactoring, passthru server config 2023-02-19 10:12:25 +09:00
tuning 2023-01-05 11:45:42 +09:00
refactoring hooks 2023-01-12 16:38:45 +09:00			`export const DefaultVoiceChangerClientSetting: VoiceChangerClientSetting = {`
gpu update 2023-01-05 18:35:56 +09:00			`audioInput: null,`
wip:model upload, set provider 2023-01-08 00:25:21 +09:00			`mmvcServerUrl: "",`
tuning 2023-01-05 11:45:42 +09:00			`protocol: "sio",`
			`sampleRate: 48000,`
server resampling added 2023-02-18 20:53:15 +09:00			`sendingSampleRate: 48000,`
tuning 2023-01-05 11:45:42 +09:00			`bufferSize: 1024,`
			`inputChunkNum: 48,`
			`speakers: [`
			`{`
WIP: support v1.5.x, improve quality 1 2023-02-12 12:25:57 +09:00			`"id": 0,`
tuning 2023-01-05 11:45:42 +09:00			`"name": "user"`
			`},`
			`{`
			`"id": 101,`
WIP: support v1.5.x, improve quality 1 2023-02-12 12:25:57 +09:00			`"name": "ずんだもん"`
tuning 2023-01-05 11:45:42 +09:00			`},`
			`{`
			`"id": 102,`
WIP: support v1.5.x, improve quality 1 2023-02-12 12:25:57 +09:00			`"name": "そら"`
tuning 2023-01-05 11:45:42 +09:00			`},`
			`{`
			`"id": 103,`
WIP: support v1.5.x, improve quality 1 2023-02-12 12:25:57 +09:00			`"name": "めたん"`
			`},`
			`{`
			`"id": 104,`
tuning 2023-01-05 11:45:42 +09:00			`"name": "つむぎ"`
			`}`
			`],`
WIP: support v1.5.x, improve quality 1 2023-02-12 12:25:57 +09:00			`correspondences: [],`
add quality control 2023-02-15 05:02:51 +09:00			`echoCancel: true,`
			`noiseSuppression: true,`
			`noiseSuppression2: false,`
WIP refactoring 2023-01-07 20:07:39 +09:00			`voiceChangerMode: "realtime",`
add downsampling mode 2023-02-14 22:32:25 +09:00			`downSamplingMode: "average",`
add gain control 2023-02-12 18:19:22 +09:00			`inputGain: 1.0,`
			`outputGain: 1.0`
WIP:client work v000 2023-01-05 02:28:36 +09:00			`}`

worklet setting 2023-01-12 04:52:01 +09:00			`export const DefaultWorkletSetting: WorkletSetting = {`
			`numTrancateTreshold: 188,`
			`volTrancateThreshold: 0.0005,`
			`volTrancateLength: 32`
			`}`
WIP refactoring 2023-01-07 20:07:39 +09:00
tuning 2023-01-05 11:45:42 +09:00			`export const VOICE_CHANGER_CLIENT_EXCEPTION = {`
			`ERR_SIO_CONNECT_FAILED: "ERR_SIO_CONNECT_FAILED",`
			`ERR_SIO_INVALID_RESPONSE: "ERR_SIO_INVALID_RESPONSE",`
WIP refactoring 2023-01-07 20:07:39 +09:00			`ERR_REST_INVALID_RESPONSE: "ERR_REST_INVALID_RESPONSE",`
			`ERR_MIC_STREAM_NOT_INITIALIZED: "ERR_MIC_STREAM_NOT_INITIALIZED"`
tuning 2023-01-05 11:45:42 +09:00
			`} as const`
			`export type VOICE_CHANGER_CLIENT_EXCEPTION = typeof VOICE_CHANGER_CLIENT_EXCEPTION[keyof typeof VOICE_CHANGER_CLIENT_EXCEPTION]`

WIP:client work v000 2023-01-05 02:28:36 +09:00
WIP: store stting 1 2023-01-29 09:42:45 +09:00			`////////////////////////////////////`
			`// indexedDB`
			`////////////////////////////////////`
			`export const INDEXEDDB_DB_APP_NAME = "INDEXEDDB_KEY_VOICE_CHANGER"`
			`export const INDEXEDDB_DB_NAME = "INDEXEDDB_KEY_VOICE_CHANGER_DB"`
			`export const INDEXEDDB_KEY_CLIENT = "INDEXEDDB_KEY_VOICE_CHANGER_LIB_CLIENT"`
			`export const INDEXEDDB_KEY_SERVER = "INDEXEDDB_KEY_VOICE_CHANGER_LIB_SERVER"`
store stting 4 2023-01-29 15:25:44 +09:00			`export const INDEXEDDB_KEY_MODEL_DATA = "INDEXEDDB_KEY_VOICE_CHANGER_LIB_MODEL_DATA"`
			`export const INDEXEDDB_KEY_WORKLET = "INDEXEDDB_KEY_VOICE_CHANGER_LIB_WORKLET"`