콘텐츠로 건너뛰기

스택오버플로우, 콘텐츠를 모델 학습에 사용하는 대기업에 과금 개시

  • 체 

ChatGPT나 이미지 생성기 Dall-E와 같은 도구의 기반이 되는 AI 시스템을 개발하는 데는 수억 달러가 소요되며, 그 비용은 점점 더 높아질 것입니다.

OpenAI, Google, 그리고 대규모 AI 프로젝트를 구축하는 다른 회사들은 전통적으로 대부분의 학습 데이터를 웹에서 스크랩하여 비용을 지불하지 않았습니다. 하지만 컴퓨터 프로그래밍 도움말을 제공하는 인기 있는 인터넷 포럼인 스택 오버플로는 올해 중반부터 대규모 AI 개발자에게 자사 서비스에 있는 5천만 개의 질문과 답변에 대한 액세스 권한을 유료화할 계획이라고 CEO Prashanth Chandrasekar는 말합니다. 이 사이트에는 2천만 명 이상의 사용자가 등록되어 있습니다.

스택 오버플로가 데이터를 활용하는 기업에게 보상을 요구하기로 한 결정은 더 광범위한 생성형 AI 전략의 일환으로, 이전에는 보고된 적이 없습니다. 이는 이번 주에 Reddit이 6월부터 일부 AI 개발자에게 자체 콘텐츠에 대한 액세스 비용을 청구할 것이라고 발표한 데 따른 것입니다.

코딩 Q&A 사이트인 StackOverflow는 Reddit의 사례에서 매우 중요한 한 페이지를 발췌했습니다.

Reddit이 온라인 데이터를 무료로 스크래핑하는 OpenAI(및 챗봇을 생성하는 다른 회사들)에 질린 상황에서 StackOverflow는 그들의 발자취를 따라 데이터에 대한 과금을 발표하기로 결정했습니다.

코딩 질문에 답하는 기능이 ChatGPT 스타일 도구의 가장 큰 사용 사례라는 점을 감안할 때, 이는 유용한 LLM의 개발을 심각하게 늦추는 요인이 될 수 있습니다. SO CEO는 한 걸음 더 나아가 OpenAI가 기여자가 자신의 콘텐츠를 소유한다는 서비스 약관을 위반했다고 비난했습니다.

관련 글  Stability AI, StableLM 출시

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다