콘텐츠로 건너뛰기

Stability AI, StableLM 출시

  • 체 

Stable Diffusion의 개발자인 Stability AI가 오픈 소스 대규모 언어 모델(LLM) 제품군인 StableLM을 출시했습니다. Stable은 상업 및 연구 목적의 개발자가 GitHub에서 사용할 수 있습니다.

이는 텍스트-이미지 생성 AI 모델인 SDXL을 공개한 지 5일 만에 나온 것입니다.

인기 있는 텍스트-이미지 생성기 Stable Diffusion을 개발한 Stability AI가 최근 새로운 오픈소스 대규모 언어 모델인 StableLM을 출시했으며, 이 모델은 GitHub에서 이용할 수 있습니다.

최근 블로그 게시물에서 이 회사는 현재 30억 개와 70억 개의 매개변수로 StableLM의 알파 버전을 사용할 수 있으며, 곧 150억 개와 650억 개가 추가될 예정이라고 발표했습니다. 새로운 대규모 언어 모델은 상업 및 연구 목적으로 개발자가 사용할 수 있습니다.

스테이블리티 AI는 ‘더 파일’을 기반으로 하지만 콘텐츠 토큰이 3배 더 많은 새로운 실험 데이터 세트를 통해 스테이블LM을 학습시켰습니다. 회사 측에 따르면 StableLM은 GPT-3(1750억 개)와 같은 다른 대규모 언어 모드에 비해 매개변수(30억~70억 개)가 적지만 코딩과 대화에 있어 높은 성능을 제공합니다.

관심 있는 사용자는 허깅 페이스에서 StableLM을 검색하여 대규모 언어 모델의 알파 버전을 확인할 수 있습니다. StableLM을 사용해 본 결과, 응답 속도가 느리고 대부분의 경우 쿼리와 전혀 관련이 없는 답변을 내놓았습니다.

예를 들어, ‘Android 기기에서 연락처를 추가하는 방법’에 대한 대체 제목을 제안해 달라는 요청에 사용자가 휴대폰의 연락처 앱을 사용하여 새 연락처를 추가할 수 있다고 답했습니다. StableLM이 ChatGPT와 같은 서비스와 경쟁하기 위해서는 아직 갈 길이 먼 것 같습니다.

새로운 대규모 언어 모델과 함께 Stability AI는 GPT4All, Dollt, ShareGPT, 알파카, HH와 같은 대화 에이전트를 사용하는 세밀하게 조정된 인스트럭션이 포함된 연구 모델 세트도 출시했습니다. 그러나 이러한 모델은 연구 목적으로만 사용되며 상업적 용도로는 사용할 수 없습니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다