혁신적인 올인원 제너레이티브 음성 모델인 Voicebox의 최신 버전이 출시되면서 Meta의 놀라운 AI 개발 속도는 계속되고 있습니다.
요약하자면
- 6개 언어로 음성 합성
- 학습되지 않은 작업 수행 가능
- 노이즈 제거, 콘텐츠 편집, 스타일 변환 등의 기능이 있습니다.
- 텍스트 음성 합성 및 언어 간 스타일 변환 지원
- 현재 모델보다 20배 빠르며 문맥 내 학습을 통해 단일 목적 모델보다 뛰어난 성능을 발휘합니다(예, 20배).
흥미롭게도 Meta는 AI 개발에 대한 일반적인 오픈 소스 접근 방식과 달리 오용 가능성이 너무 위험하기 때문에 모델/코드를 공개하지 않기로 결정했습니다.
장난 전화가 한 단계 더 발전할 것입니다. AI를 사용하면 누구의 목소리도 복제할 수 있다는 사실을 사랑하는 사람들에게 매일 알려주는 알림이 될 것입니다.
혁명이 다가오고 있다.
오직 상상력만으로 명화를 그리고 글을 쓰고 곡을 만들고 프로그래밍 할 수 있는 격변의 시기!
생성 AI로 세계를 바꾸자.