생성 AI: 창의적인 새로운 세상

원문: https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/

강력하고 새로운 클래스의 대규모 언어 모델을 통해 기계가 신뢰할 수 있고 때로는 초인적인 결과로 글을 쓰고, 코딩하고, 그림을 그리고, 창작할 수 있게 되었습니다.

인간은 사물을 분석하는 데 능숙합니다. 기계는 훨씬 더 뛰어납니다. 기계는 일련의 데이터를 분석하고 그 안에서 패턴을 찾아내어 사기나 스팸 탐지, 배송 예상 시간 예측, 다음에 보여줄 TikTok 동영상 예측 등 다양한 사용 사례에 활용할 수 있습니다. 이러한 작업은 점점 더 똑똑해지고 있습니다. 이를 ‘분석 AI’ 또는 기존 AI라고 합니다.

하지만 인간은 사물을 분석하는 데만 능한 것이 아니라 창조하는 데도 능숙합니다. 우리는 시를 쓰고, 제품을 디자인하고, 게임을 만들고, 코드를 작성합니다. 최근까지 기계는 창의적인 작업에서 인간과 경쟁할 기회가 없었으며, 분석과 암기식 인지 노동에 국한되어 있었습니다. 하지만 기계는 이제 막 감각적이고 아름다운 것을 만드는 데 능숙해지기 시작했습니다. 이 새로운 범주를 ‘생성형 AI’라고 하는데, 이는 기계가 이미 존재하는 것을 분석하는 것이 아니라 새로운 것을 생성한다는 의미입니다.

생성 AI는 인간이 손으로 만드는 것보다 더 빠르고 저렴할 뿐만 아니라 어떤 경우에는 더 나은 성능을 발휘할 수 있는 단계에 이르렀습니다. 소셜 미디어에서 게임, 광고, 건축, 코딩, 그래픽 디자인, 제품 디자인, 법률, 마케팅, 영업에 이르기까지 인간이 독창적인 작업을 만들어야 하는 모든 산업이 재창조될 수 있습니다. 어떤 기능은 생성 AI로 완전히 대체될 수도 있고, 어떤 기능은 인간과 기계 간의 긴밀한 반복적 창작 주기를 통해 번창할 가능성이 높지만, 생성 AI는 광범위한 최종 시장에서 더 빠르고, 더 저렴하게 더 나은 창작물을 만들 수 있게 해줄 것입니다. 생성 AI가 창작과 지식 작업의 한계 비용을 0으로 낮춰 막대한 노동 생산성과 경제적 가치를 창출하고 그에 상응하는 시가총액을 창출하는 것이 꿈입니다.

생성 AI가 다루는 분야인 지식 업무와 창의적 업무에는 수십억 명의 근로자가 종사하고 있습니다. 제너레이티브 AI는 이러한 근로자의 효율성과 창의성을 최소 10% 이상 향상시킬 수 있으며, 이전보다 더 빠르고 효율적일 뿐만 아니라 더 많은 능력을 갖추게 됩니다. 따라서 제너레이티브 AI는 수조 달러의 경제적 가치를 창출할 수 있는 잠재력을 가지고 있습니다.

왜 지금인가?

제너레이티브 AI는 더 나은 모델, 더 많은 데이터, 더 많은 컴퓨팅 등 더 넓은 범위의 AI와 동일한 ‘왜 지금인가’를 가지고 있습니다. 이 범주는 우리가 파악할 수 있는 것보다 더 빠르게 변화하고 있지만, 현재의 맥락을 파악하기 위해 최근의 역사를 크게 살펴볼 필요가 있습니다.

웨이브 1: 소규모 모델이 대세(2015년 이전)

5년 이상 전에는 소규모 모델이 언어 이해를 위한 ‘최첨단’으로 간주되었습니다.

이러한 소규모 모델은 분석 작업에 탁월하여 배송 시간 예측부터 사기 분류까지 다양한 업무에 활용되었습니다. 하지만 범용 생성 작업에는 충분한 표현력을 갖추지 못했습니다. 사람 수준의 작성이나 코드를 생성하는 것은 여전히 꿈같은 일입니다.

웨이브 2: 확장 경쟁(2015~현재)

Google Research의 획기적인 논문(주의만 기울이면 된다)에서는 우수한 품질의 언어 모델을 생성하는 동시에 병렬화가 가능하고 훈련에 훨씬 적은 시간을 필요로 하는 트랜스포머라는 자연어 이해를 위한 새로운 신경망 아키텍처에 대해 설명합니다. 이러한 모델은 단기간에 학습할 수 있으며 특정 도메인에 맞게 비교적 쉽게 맞춤 설정할 수 있습니다.

AI 모델이 점점 더 커지면서 인간의 주요 성능 벤치마크를 능가하기 시작했습니다. 출처: © THE ECONOMIST NEWS LIMITED, LONDON, June 11, 2022. 모든 권리 보유; science.org/content/article/computers-ace-iq-tests-still-make-dumb-mistakes-can-different-tests-help

물론 모델이 점점 더 커지면서 인간 수준, 나아가 초인적인 수준의 결과를 제공하기 시작했습니다. 2015년과 2020년 사이에 이러한 모델을 훈련하는 데 사용되는 컴퓨팅은 6배나 증가했으며, 그 결과 필기, 음성 및 이미지 인식, 독해 및 언어 이해에서 인간의 성능 벤치마크를 뛰어넘는 결과를 얻었습니다. 이 모델의 성능은 GPT-2에 비해 비약적으로 향상되었으며, 코드 생성부터 비꼬는 농담 작성에 이르기까지 다양한 작업에서 트위터 데모를 통해 놀라운 성능을 선보입니다.

READ 스테이블 디퓨전, 마침내 손을 그리다

이러한 근본적인 연구 진전에도 불구하고 이러한 모델은 널리 보급되지 않았습니다. 규모가 크고 실행하기 어렵고(GPU 오케스트레이션 필요), 광범위하게 액세스할 수 없으며(사용 불가 또는 클로즈 베타만 제공), 클라우드 서비스로 사용하기에는 비용이 많이 들기 때문입니다. 이러한 한계에도 불구하고 초기 제너레이티브 AI 애플리케이션이 경쟁에 뛰어들기 시작했습니다.

웨이브 3: 더 좋고, 더 빠르고, 더 저렴해짐(2022년 이상)

컴퓨팅 비용이 점점 더 저렴해집니다. 확산 모델과 같은 새로운 기술은 추론을 훈련하고 실행하는 데 필요한 비용을 줄여줍니다. 연구 커뮤니티는 계속해서 더 나은 알고리즘과 더 큰 모델을 개발하고 있습니다. 개발자 액세스가 클로즈 베타에서 오픈 베타로, 또는 경우에 따라 오픈 소스로 확장됩니다.

LLM에 대한 액세스가 부족했던 개발자들에게 이제 탐색과 애플리케이션 개발을 위한 문이 열렸습니다. 애플리케이션이 꽃을 피우기 시작합니다.

ILLUSTRATION GENERATED WITH MIDJOURNEY

웨이브 4: 킬러 앱의 등장(지금)

플랫폼 계층이 견고해지고, 모델이 지속적으로 개선/고속화/저렴해지고, 모델 액세스가 무료 및 오픈 소스로 전환되는 추세에 따라 애플리케이션 계층은 창의성이 폭발적으로 증가할 수 있는 무르익은 시기입니다.

모바일이 GPS, 카메라, 이동 중 연결과 같은 새로운 기능을 통해 새로운 유형의 애플리케이션을 탄생시킨 것처럼, 이러한 대규모 모델이 새로운 생성형 AI 애플리케이션의 물결을 일으킬 것으로 예상합니다. 그리고 10년 전 모바일의 변곡점이 소수의 킬러 앱을 위한 시장을 창출한 것처럼, 제너레이티브 AI에서도 킬러 앱이 등장할 것으로 예상합니다. 경쟁은 시작되었습니다.

시장 환경

아래는 각 카테고리를 뒷받침할 플랫폼 계층과 그 위에 구축될 잠재적인 애플리케이션 유형을 설명하는 도식입니다.

모델

텍스트는 가장 진보된 영역입니다. 하지만 자연어는 제대로 구사하기가 어렵고 품질이 중요합니다. 현재 모델은 일반적인 단문/중간 형식의 글쓰기에 꽤 능숙합니다(하지만 이 경우에도 일반적으로 반복 작업이나 초안 작성에 사용됩니다). 시간이 지남에 따라 모델이 개선됨에 따라 더 높은 품질의 결과물, 더 긴 형식의 콘텐츠, 더 나은 수직별 튜닝을 기대할 수 있습니다.
코드 생성은 단기적으로 개발자 생산성에 큰 영향을 미칠 것으로 보이며, 이는 GitHub CoPilot에서 확인할 수 있습니다. 또한 비개발자가 코드를 창의적으로 사용하는 데 더 쉽게 접근할 수 있게 될 것입니다.
이미지는 최근의 현상이지만, 트위터에서 텍스트보다 생성된 이미지를 공유하는 것이 훨씬 더 재미있다는 입소문이 퍼지고 있습니다! 다양한 미적 스타일을 가진 이미지 모델과 생성된 이미지를 편집하고 수정하는 다양한 기술이 등장하고 있습니다.
음성 합성 기능은 한동안 사용되어 왔지만(안녕하세요, Siri!), 이제 막 소비자 및 기업용 애플리케이션이 등장하고 있습니다. 영화나 팟캐스트와 같은 고급 애플리케이션의 경우 기계적으로 들리지 않는 인간적인 음성의 원샷 음성에 대한 기대치가 상당히 높습니다. 하지만 이미지와 마찬가지로 오늘날의 모델은 실용적인 애플리케이션을 위한 추가 다듬기 또는 최종 결과물을 위한 출발점을 제공합니다.
비디오 및 3D 모델이 빠르게 발전하고 있습니다. 사람들은 영화, 게임, VR, 건축, 실제 제품 디자인과 같은 대규모 크리에이티브 시장을 개척할 수 있는 이러한 모델의 잠재력에 큰 기대를 걸고 있습니다. 연구 기관에서는 지금 이 순간에도 기초적인 3D 및 비디오 모델을 공개하고 있습니다.
다른 영역: 오디오와 음악부터 생물학, 화학(생성 단백질과 분자, 아시나요?)에 이르기까지 다양한 분야에서 기초 모델 R&D가 진행되고 있습니다.

아래 차트는 기본 모델이 어떻게 발전할 것으로 예상되는지, 그리고 관련 애플리케이션이 어떻게 가능해질지에 대한 타임라인을 보여줍니다. 2025년 이후는 추측일 뿐입니다.

애플리케이션

다음은 저희가 기대하는 몇 가지 애플리케이션입니다. 이 페이지에 소개한 것보다 훨씬 더 많은 애플리케이션이 있으며, 창업자와 개발자가 꿈꾸는 창의적인 애플리케이션에 매료되어 있습니다.

카피라이팅: 판매 및 마케팅 전략과 고객 지원을 위해 개인화된 웹 및 이메일 콘텐츠에 대한 필요성이 증가함에 따라 언어 모델에 적합한 애플리케이션입니다. 짧은 형식과 양식화된 문구의 특성과 이러한 팀의 시간 및 비용 압박이 결합되어 자동화 및 증강 솔루션에 대한 수요가 증가할 것입니다.
수직적 글쓰기 어시스턴트: 오늘날 대부분의 글쓰기 어시스턴트는 수평적이지만, 법률 계약서 작성부터 시나리오 작성에 이르기까지 특정 최종 시장을 위한 훨씬 더 나은 제너레이티브 애플리케이션을 구축할 수 있는 기회가 있다고 생각합니다. 여기서 제품 차별화는 특정 워크플로우를 위한 모델과 UX 패턴의 미세 조정에 있습니다.
코드 생성: 현재 애플리케이션은 개발자의 생산성을 크게 높여줍니다: 현재 GitHub Copilot이 설치된 프로젝트에서 코드의 거의 40%를 생성하고 있습니다. 하지만 더 큰 기회는 소비자에게 코딩에 대한 액세스를 개방하는 것일 수 있습니다. 프롬프트를 배우는 것이 궁극적인 고급 프로그래밍 언어가 될 수도 있습니다.
예술 세대: 이제 미술사와 대중 문화의 전 세계가 이 대형 모델에 인코딩되어 누구나 이전에는 마스터하는 데 평생이 걸렸던 주제와 스타일을 마음대로 탐색할 수 있습니다.
게임: 자연어를 사용하여 복잡한 장면이나 리깅이 가능한 모델을 만드는 것이 꿈이지만, 그 최종 상태는 먼 미래의 일이지만 텍스처와 스카이박스 아트 생성처럼 단기간에 실행 가능한 더 즉각적인 옵션이 있습니다.
미디어/광고: 대행사 업무를 자동화하고 소비자를 위해 광고 카피와 크리에이티브를 즉석에서 최적화할 수 있는 잠재력을 상상해 보세요. 판매 메시지와 상호 보완적인 비주얼을 결합하는 멀티모달 생성을 위한 좋은 기회입니다.
디자인: 디지털 및 실제 제품의 프로토타입 제작은 노동 집약적이고 반복적인 프로세스입니다. 러프 스케치와 프롬프트를 통한 고퀄리티 렌더링은 이미 현실이 되었습니다. 3D 모델을 사용할 수 있게 되면서 제너레이티브 디자인 프로세스는 제조 및 생산(텍스트에서 오브젝트까지)까지 확장될 것입니다. 다음 아이폰 앱이나 운동화가 기계에 의해 디자인될 수도 있습니다.
소셜 미디어와 디지털 커뮤니티: 제너레이티브 툴을 사용하여 자신을 표현하는 새로운 방법이 있을까요? Midjourney와 같은 새로운 애플리케이션은 소비자들이 공개적으로 창작하는 법을 배우면서 새로운 소셜 경험을 창출하고 있습니다.

최고의 제너레이티브 AI 기업은 사용자 참여/데이터와 모델 성능 사이에서 끊임없이 실행함으로써 지속 가능한 경쟁 우위를 확보할 수 있습니다.

ILLUSTRATION GENERATED WITH MIDJOURNEY

제너레이티브 AI 애플리케이션의 구조

제너레이티브 AI 애플리케이션은 어떤 모습일까요? 다음은 몇 가지 예측입니다.

READ AI 기반 검색 기능을 추가한 Yelp

인텔리전스 및 모델 미세 조정

제너레이티브 AI 앱은 GPT-3 또는 Stable Diffusion과 같은 대규모 모델을 기반으로 구축됩니다. 이러한 애플리케이션은 더 많은 사용자 데이터를 확보함에 따라 다음과 같이 모델을 미세 조정할 수 있습니다: 1) 특정 문제 공간에 대한 모델 품질/성능을 개선하고; 2) 모델 크기/비용을 줄일 수 있습니다.

제너레이티브 AI 앱은 범용 대형 모델인 ‘빅 브레인’ 위에 있는 UI 레이어이자 ‘리틀 브레인’으로 생각할 수 있습니다.

폼 팩터

오늘날 제너레이티브 AI 앱은 대부분 기존 소프트웨어 에코시스템에 플러그인 형태로 존재합니다. 코드 완성은 IDE에서, 이미지 생성은 Figma 또는 Photoshop에서, 심지어 Discord 봇은 디지털/소셜 커뮤니티에 제너레이티브 AI를 주입하는 그릇입니다.

카피라이팅을 위한 Jasper와 Copy.ai, 동영상 편집을 위한 Runway, 메모 작성을 위한 Mem과 같은 독립형 제너레이티브 AI 웹 앱도 소수에 불과합니다.

플러그인은 자체 애플리케이션을 부트스트랩하는 데 효과적인 쐐기가 될 수 있으며, 사용자 데이터와 모델 품질(모델을 개선하기 위해 충분한 사용량을 확보하려면 배포가 필요하고, 사용자를 유치하려면 좋은 모델이 필요함)의 치킨 앤 에그 문제를 극복하는 현명한 방법이 될 수 있습니다. 이러한 배포 전략은 소비자/소셜과 같은 다른 시장 카테고리에서도 성과를 거두고 있습니다.

상호 작용의 패러다임

오늘날 대부분의 제너레이티브 AI 데모는 사용자가 입력을 제공하면 기계가 출력을 뱉어내고, 사용자는 이를 유지하거나 버리고 다시 시도할 수 있는 ‘일회성’ 방식입니다. 점점 더 많은 모델이 반복적인 작업을 통해 출력을 수정하고, 정교하게 다듬고, 레벨을 올리고, 변형을 생성할 수 있게 되고 있습니다.

오늘날 제너레이티브 AI 출력물은 프로토타입이나 초안으로 사용되고 있습니다. 애플리케이션은 창의적인 프로세스를 진행하기 위해 여러 가지 다양한 아이디어(예: 로고 또는 건축 디자인에 대한 다양한 옵션)를 뱉어내는 데 능숙하며, 최종 상태에 도달하기 위해 사용자가 수정해야 하는 첫 번째 초안(예: 블로그 게시물 또는 코드 자동 완성)을 제안하는 데 능숙합니다. 사용자 데이터를 기반으로 모델이 점점 더 똑똑해짐에 따라 이러한 초안은 최종 제품으로 사용할 수 있을 만큼 충분히 좋아질 때까지 점점 더 좋아질 것으로 예상해야 합니다.

READ 워드프레스, AI 텍스트 어시스턴트 출시

지속적인 카테고리 리더십

최고의 제너레이티브 AI 기업은 사용자 참여/데이터와 모델 성능 사이에서 끊임없이 실행함으로써 지속 가능한 경쟁 우위를 창출할 수 있습니다. 이기기 위해서는 1) 뛰어난 사용자 참여도 확보 → 2) 더 많은 사용자 참여를 더 나은 모델 성능(신속한 개선, 모델 미세 조정, 레이블이 지정된 학습 데이터로서의 사용자 선택) → 3) 우수한 모델 성능을 사용하여 더 많은 사용자 성장과 참여를 유도함으로써 이 플라이휠을 작동시켜야 합니다. 이들은 모든 사람에게 모든 것이 되려고 하기보다는 특정 문제 영역(예: 코드, 디자인, 게임)에 집중할 가능성이 높습니다. 먼저 애플리케이션에 깊이 통합하여 활용 및 배포한 후 기존 애플리케이션을 AI 네이티브 워크플로우로 대체하려고 시도할 가능성이 높습니다. 이러한 애플리케이션을 올바른 방식으로 구축하여 사용자와 데이터를 축적하는 데는 시간이 걸리겠지만, 최고의 애플리케이션은 내구성이 뛰어나고 대규모로 성장할 기회를 갖게 될 것입니다.

생성 AI는 아직 초기 단계입니다. 플랫폼 계층은 이제 막 발전하고 있으며 애플리케이션 영역은 이제 겨우 시작되었습니다.

장애물과 위험

눈을 크게 뜨고 지켜보기

제너레이티브 AI는 아직 초기 단계입니다. 플랫폼 계층은 이제 막 발전하고 있으며 애플리케이션 영역은 이제 막 시작되었습니다.

분명한 것은 제너레이티브 AI를 잘 활용하기 위해 톨스토이 소설을 쓰기 위해 대규모 언어 모델이 필요한 것은 아니라는 점입니다. 오늘날 이러한 모델은 블로그 게시물의 초안을 작성하고 로고와 제품 인터페이스의 프로토타입을 생성하는 데 충분히 유용합니다. 중-단기적으로는 수많은 가치 창출이 이루어질 것입니다.

이러한 제너레이티브 AI 애플리케이션의 첫 번째 물결은 아이폰이 처음 출시되었을 때의 모바일 애플리케이션 환경, 즉 다소 기발하고 얇으며 경쟁 차별화 및 비즈니스 모델이 불분명한 것과 유사합니다. 하지만 이러한 애플리케이션 중 일부는 미래에 어떤 일이 일어날지 흥미롭게 엿볼 수 있습니다. 기계가 복잡한 기능의 코드나 멋진 이미지를 만들어내는 것을 보고 나면, 기계가 우리가 일하고 창조하는 방식에 근본적인 역할을 하지 않는 미래는 상상하기 어렵습니다.

수십 년 후의 미래를 상상해 본다면, 제너레이티브 AI가 우리가 일하고, 만들고, 즐기는 방식에 깊숙이 자리 잡은 미래를 쉽게 상상할 수 있습니다. 스스로 작성되는 메모, 상상할 수 있는 모든 것을 3D 프린팅, 텍스트에서 픽사 영화로 전환, 상상하는 것만큼 빠르게 풍부한 세계를 생성하는 Roblox 같은 게임 경험 등 말 그대로 ‘제너레이티브 AI’가 우리의 일과 창작, 놀이 방식에 깊숙이 자리 잡게 되는 것이죠. 이러한 경험은 오늘날 공상 과학 소설처럼 보일 수 있지만, 몇 년 만에 좁은 언어 모델에서 코드 자동 완성 기능으로 발전하는 등 그 발전 속도가 매우 빠르며, 이러한 변화의 속도를 따라 ‘대형 모델 무어의 법칙’을 따른다면, 이러한 터무니없는 시나리오는 곧 실현 가능한 영역으로 진입할 수 있을 것입니다.

스타트업 모집

우리는 기술의 플랫폼 전환의 시작점에 서 있습니다. 저희는 이미 이 분야에 많은 투자를 해왔으며, 이 분야에서 야심차게 사업을 시작하는 창업자들에 의해 활기를 얻고 있습니다.

창업자 중 미팅을 원하시는 분은 sonya@sequoiacap.com 및 grady@sequoiacap.com 으로 문의해 주세요.

여러분의 이야기를 듣고 싶습니다.

추신: 이 글은 GPT-3와 공동 집필했습니다. GPT-3는 기사 전체를 작성하지는 않았지만, 작가 블록을 극복하고, 전체 문장과 단락을 생성하고, 생성형 AI의 다양한 사용 사례를 브레인스토밍하는 역할을 담당했습니다. GPT-3로 이 기사를 작성하면서 새로운 표준이 될 수 있는 인간과 컴퓨터의 공동 창작 상호 작용을 맛볼 수 있었습니다. 또한 이 글의 일러스트를 Midjourney와 함께 제작했는데 정말 재미있었습니다!

생성 AI: 창의적인 새로운 세상