https://github.com/liusongxiang/StarGAN-Voice-Conversion
GitHub - liusongxiang/StarGAN-Voice-Conversion: This is a pytorch implementation of the paper: StarGAN-VC: Non-parallel many-to-
This is a pytorch implementation of the paper: StarGAN-VC: Non-parallel many-to-many voice conversion with star generative adversarial networks - GitHub - liusongxiang/StarGAN-Voice-Conversion: T...
github.com
원본 깃헙은 여기.
진짜 뭐 별거 없이 원본 디렉토리 비우고 거기 데이터 넣거나 preprocess.py, main.py에서 데이터 디렉토리 바꾸고 돌리면 됨. 다만 원래 코드랑 speaker 정보가 달라서 수정.
위 코드는 2 class에서 p1->p2 변환하는 코드라 다음과 같이 했으나 원본 코드처럼 여러명(4class)으로 돌려본 결과 학습 잘 되고 성능이 더 떨어지지도 않음. starGAN의 장점인듯.
'Project > AI_Human(GAN)' 카테고리의 다른 글
[AI Human 5] FSGAN inference 성능 높이기 간단 팁 (0) | 2021.11.04 |
---|---|
[AI Human 4] FSGAN 파라미터 튜닝 (구글코랩프로) (0) | 2021.11.02 |
[AI Human 3] FSGAN으로 딥페이크 얼굴 영상합성 (ffmpeg 모듈 충돌 해결) (0) | 2021.11.02 |
[AI Human 1] Python 음성데이터 (wav 파일) 길이 분포 알아보기 (0) | 2021.11.02 |