콘텐츠로 건너뛰기

생성 AI(Generative AI)가 창작 작업을 변화시키는 방법

  • 체 
이 글은 생성 AI란? 시리즈 4 개의 글 중 3 번글입니다.

원문: https://hbr.org/2022/11/how-generative-ai-is-changing-creative-work

(이전과 달리 전문 번역을 하지 않았습니다. 파파고나 구글 번역보다 훨씬 만족스러운 수준의 번역을 제공하는 Deepl.com을 이용해 전체를 번역하고 원문과 다른 뉘앙스가 느껴지는 일부 번역만 수정했습니다.)

Andriy Onufriyenko/Getty Images

생성 AI 또는 파운데이션 모델이라고도 하는 대규모 언어 및 이미지 AI 모델은 콘텐츠 제작을 수행하는 기업과 전문가에게 새로운 기회를 창출했습니다. 이러한 기회 중 일부는 다음과 같습니다:

  1. 자동화된 콘텐츠 생성: 대규모 언어 및 이미지 AI 모델을 사용하여 기사, 블로그 게시물 또는 소셜 미디어 게시물과 같은 콘텐츠를 자동으로 생성할 수 있습니다. 이는 정기적으로 콘텐츠를 제작하는 비즈니스와 전문가에게 시간을 절약할 수 있는 유용한 도구가 될 수 있습니다.
  2. 콘텐츠 품질 향상: AI 모델은 대량의 데이터를 통해 학습하고 사람이 볼 수 없는 패턴을 식별할 수 있기 때문에 AI로 생성된 콘텐츠는 사람이 만든 콘텐츠보다 품질이 더 높을 수 있습니다. 따라서 더 정확하고 유익한 콘텐츠를 제공할 수 있습니다.
  3. 콘텐츠의 다양성 증가: AI 모델은 텍스트, 이미지, 동영상 등 다양한 유형의 콘텐츠를 생성할 수 있습니다. 이를 통해 기업과 전문가는 더 많은 사람들에게 어필할 수 있는 더욱 다양하고 흥미로운 콘텐츠를 만들 수 있습니다.
  4. 개인화된 콘텐츠: AI 모델은 개별 사용자의 선호도에 따라 개인화된 콘텐츠를 생성할 수 있습니다. 이를 통해 기업과 전문가는 타겟 고객이 관심을 가질 가능성이 높고, 따라서 읽거나 공유할 가능성이 높은 콘텐츠를 만들 수 있습니다.

이 기술은 창의적인 작업을 하는 인간의 노력을 얼마나 능숙하게 모방할 수 있을까요? 예를 들어, 위의 이탤릭체로 표시된 텍스트는 우리가 작성한 첫 번째 문장에 대한 응답으로 OpenAI에서 만든 ‘대규모 언어 모델(LLM)’인 GPT-3에 의해 작성되었습니다. GPT-3의 텍스트는 대부분의 AI 생성 콘텐츠의 강점과 약점을 반영합니다. 첫째, 입력된 프롬프트에 민감하게 반응하여 여러 가지 대체 프롬프트를 시도한 후 이 문장을 결정했습니다. 둘째, 시스템은 합리적으로 잘 작성하며 문법적인 실수가 없고 단어 선택이 적절합니다. 셋째, 편집에 도움이 됩니다. 예를 들어, 일반적으로 이런 글은 번호가 매겨진 목록으로 시작하지 않습니다. 마지막으로, 우리가 생각하지 못한 아이디어를 제시했습니다. 예를 들어, 개인화된 콘텐츠에 대한 마지막 요점은 우리가 고려하지 않았던 것입니다.

전반적으로 이러한 AI 모델이 비즈니스에 가져올 수 있는 잠재적 가치를 잘 보여줍니다. 마케팅, 소프트웨어, 디자인, 엔터테인먼트 및 대인 커뮤니케이션에 상당한 영향을 미치면서 콘텐츠 제작의 세계를 뒤흔들고 있습니다. 이것은 인간이 오랫동안 꿈꾸고 두려워해 온 ‘범용 인공 지능’(특정 문제만을 해결하는 좁은 인공지능이 아닌, 사람과 같은 지능을 구현하는 인공지능)은 아니지만, 일반인에게는 그렇게 보일 수 있습니다.

생성 AI란 무엇인가요?

생성 AI는 이미 많은 일을 할 수 있습니다. 블로그 게시물, 프로그램 코드, 시, 예술 작품 등 다양한 텍스트와 이미지를 생성할 수 있습니다(논란의 여지가 있지만, 심지어 경연 대회에서 우승하기도 했습니다). 이 소프트웨어는 복잡한 머신러닝 모델을 사용하여 이전 단어 시퀀스를 기반으로 다음 단어를 예측하거나 이전 이미지를 설명하는 단어를 기반으로 다음 이미지를 예측합니다. LLM은 2017년 Google Brain에서 처음 시작되었으며, 처음에는 문맥을 유지하면서 단어를 번역하는 데 사용되었습니다. 그 이후로 Google(BERT 및 LaMDA), Facebook(OPT-175B, BlenderBot), Microsoft가 주요 투자자인 비영리 단체 OpenAI(텍스트용 GPT-3, 이미지용 DALL-E2, 음성용 Whisper) 등 주요 기술 회사에서 대규모 언어 및 텍스트-대-이미지 모델이 확산되고 있습니다. 미술 대회에서 우승한 Midjourney와 같은 온라인 커뮤니티와 HuggingFace와 같은 오픈 소스 제공업체도 생성 모델을 만들었습니다.

관련 글  도시, 스팀 펑크: stable diffusion

이러한 모델을 학습하려면 방대한 양의 데이터와 컴퓨팅 성능이 필요하기 때문에 주로 큰 기술 회사에만 국한되어 왔습니다. 예를 들어, GPT-3는 처음에 45테라바이트의 데이터로 학습되었고 예측을 위해 1,750억 개의 매개변수 또는 계수를 사용했으며, GPT-3의 단일 학습 실행에는 1,200만 달러가 소요되었습니다. 중국 모델인 우다오 2.0에는 1조 7,500억 개의 파라미터가 있습니다. 대부분의 기업에는 이러한 유형의 모델을 처음부터 자체적으로 학습시킬 수 있는 데이터 센터 역량이나 클라우드 컴퓨팅 예산이 없습니다.

하지만 일단 생성 모델을 학습시키면 훨씬 적은 데이터로 특정 콘텐츠 도메인에 맞게 ‘미세 조정’할 수 있습니다. 그 결과 생물의학 콘텐츠(BioBERT), 법률 콘텐츠(Legal-BERT), 프랑스어 텍스트(CamemBERT)를 위한 BERT와 다양한 특정 목적을 위한 GPT-3의 전문 모델이 탄생했습니다. 엔비디아의 BioNeMo는 생성 화학, 프로테오믹스 및 DNA/RNA를 위한 슈퍼컴퓨팅 규모의 대규모 언어 모델을 훈련, 구축 및 배포하기 위한 프레임워크입니다.OpenAI는 도메인별 데이터의 특정 예제가 100개만 있어도 이를 뒷받침할 수 있다는 사실을 발견했습니다.

생성 AI를 효과적으로 사용하려면 프로세스의 시작과 끝 모두에 사람의 참여가 필요합니다.

우선, 사람이 생성 모델에 프롬프트를 입력하여 콘텐츠를 생성하도록 해야 합니다. 일반적으로 창의적인 프롬프트는 창의적인 결과물을 산출합니다. ‘프롬프트 엔지니어’는 적어도 더 똑똑한 차세대 AI가 등장할 때까지는 확고한 직업으로 자리 잡을 가능성이 높습니다. 이 분야에서는 이미 82페이지 분량의 DALL-E 2 이미지 프롬프트 책이 출간되었고, 적은 비용으로 다른 사용자의 프롬프트를 구매할 수 있는 프롬프트 마켓플레이스도 생겨났습니다. 이러한 시스템을 사용하는 대부분의 사용자는 원하는 결과를 얻기 전에 여러 가지 프롬프트를 시도해야 합니다.

그런 다음 모델이 콘텐츠를 생성하면 사람이 신중하게 평가하고 편집해야 합니다. 대체 프롬프트 출력을 단일 문서로 결합할 수도 있습니다. 이미지 생성에는 상당한 조작이 필요할 수 있습니다. 미드저니의 도움을 받아 콜로라도주 ‘디지털 조작 사진’ 콘테스트에서 우승한 제이슨 앨런은 기자에게 900개 이상의 아트 버전을 만드는 데 80시간 이상을 투자했으며, 프롬프트를 계속해서 미세 조정했다고 말했습니다. 그런 다음 Adobe Photoshop으로 결과물을 개선하고 다른 AI 툴로 이미지 품질과 선명도를 높인 후 캔버스에 세 작품을 인쇄했습니다.

생성 AI 모델은 매우 다양합니다. 이미지, 긴 텍스트 형식, 이메일, 소셜 미디어 콘텐츠, 음성 녹음, 프로그램 코드, 구조화된 데이터 등의 콘텐츠를 가져올 수 있습니다. 새로운 콘텐츠, 번역, 질문에 대한 답변, 감정 분석, 요약, 심지어 동영상까지 출력할 수 있습니다. 이러한 범용 콘텐츠 머신은 비즈니스에 다양하게 활용될 수 있으며, 그 중 몇 가지를 아래에 설명합니다.

마케팅 애플리케이션

이러한 생성 모델은 여러 비즈니스 기능에 걸쳐 잠재적으로 유용할 수 있지만, 마케팅 애플리케이션이 가장 일반적입니다. 예를 들어, 마케팅에 초점을 맞춘 GPT-3 버전인 Jasper는 블로그, 소셜 미디어 게시물, 웹 카피, 영업 이메일, 광고 및 기타 유형의 고객 대면 콘텐츠를 생성할 수 있습니다. 또한 A/B 테스트를 통해 결과물을 자주 테스트하고 콘텐츠가 검색 엔진 배치에 최적화되도록 유지합니다. 또한 고객의 최상의 결과물에 맞춰 GPT-3 모델을 미세 조정하고 있으며, 이를 통해 상당한 개선이 이루어졌다고 Jasper의 경영진은 말합니다. 재스퍼의 고객 대부분은 개인과 소규모 기업이지만, 대기업 내 일부 그룹도 재스퍼의 역량을 활용하고 있습니다. 예를 들어, 클라우드 컴퓨팅 회사인 VMWare에서는 이메일부터 제품 캠페인, 소셜 미디어 카피에 이르기까지 마케팅을 위한 독창적인 콘텐츠를 제작할 때 작가들이 Jasper를 사용합니다. 제품 주도 성장 담당 이사인 Rosa Lear는 Jasper가 회사의 콘텐츠 전략을 강화하는 데 도움이 되었으며, 이제 작가들이 더 나은 연구, 아이디어, 전략을 수립할 수 있는 시간을 갖게 되었다고 말합니다.

홍보 및 소셜 미디어 에이전시 Ruby Media Group의 소유주인 크리스 루비는 이제 생성 모델을 통한 텍스트 및 이미지 생성을 모두 사용하고 있습니다. 검색 엔진 최적화(SEO)를 극대화하는 데 효과적이며, PR에서는 작가에게 개인화된 피치를 제공하는 데 효과적이라고 말합니다. 그녀는 이러한 새로운 도구가 저작권 문제의 새로운 지평을 열었다고 믿으며, 고객을 위한 AI 정책을 수립하는 데 도움을 주고 있습니다. 그녀는 도구를 사용할 때 프롬프트, 편집, 반복이 너무 많기 때문에 “AI는 10%, 내가 90%”라고 말합니다. 그녀는 이러한 도구가 검색 엔진 검색을 위해 글을 더 잘 쓰고 더 완성도 있게 만들며, 이미지 생성 도구가 스톡 사진 시장을 대체하고 창의적인 작업의 르네상스를 이끌 수 있다고 생각합니다.

관련 글  초보자를 위한 ChatGPT 초급 과정을 소개합니다

DALL-E 2 및 기타 이미지 생성 도구는 이미 광고에 사용되고 있습니다. 예를 들어, 하인즈는 하인즈와 유사한 라벨이 부착된 케첩 병 이미지를 사용하여 “인공지능에게 ‘케첩’은 이렇게 생겼습니다.”라고 주장했습니다. 물론 이 모델은 비교적 많은 수의 하인즈 케첩 병 사진으로 학습되었다는 의미일 뿐입니다. Nestle은 요거트 브랜드 중 하나를 판매하기 위해 AI로 강화된 베르메르 그림 버전을 사용했습니다. 이미 AI를 사용하여 고객에게 특정 의류를 추천하는 의류 회사인 Stitch Fix는 색상, 원단, 스타일에 대한 고객의 선호도를 기반으로 의류의 시각화를 생성하기 위해 DALL-E 2를 실험하고 있습니다. Mattel은 장난감 디자인 및 마케팅을 위한 이미지를 생성하는 데 이 기술을 사용하고 있습니다.

코드 생성 애플리케이션

특히 GPT-3는 완벽하지는 않더라도 컴퓨터 프로그램 코드를 효과적으로 생성하는 것으로 입증되었습니다. “스니펫” 또는 작은 프로그램 기능에 대한 설명이 주어지면 코드 생성을 위해 특별히 훈련된 GPT-3의 Codex 프로그램은 다양한 언어로 코드를 생성할 수 있습니다. Microsoft의 Github에는 CoPilot이라는 코드 생성용 GPT-3 버전도 있습니다. 최신 버전의 코덱스는 이제 자체 코드에서 버그를 식별하고 실수를 수정할 수 있으며, 심지어 코드가 무엇을 하는지도 설명할 수 있습니다. Microsoft의 목표는 인간 프로그래머를 없애는 것이 아니라 코덱스나 CoPilot과 같은 도구와 인간이 ‘페어 프로그래머’로서 속도와 효율성을 개선하는 것입니다.

LLM 기반 코드 생성에 대한 합의는 이러한 스니펫에는 잘 작동하지만 더 큰 프로그램에 통합하고 특정 기술 환경에 프로그램을 통합하려면 여전히 사람의 프로그래밍 역량이 필요하다는 것입니다. 딜로이트는 지난 몇 달 동안 코덱스를 광범위하게 실험한 결과, 코덱스가 숙련된 개발자의 생산성을 높이고 경험이 없는 개발자에게도 어느 정도 프로그래밍 능력을 부여할 수 있다는 사실을 확인했습니다.

55명의 개발자를 대상으로 6주 동안 Deloitte에서 실시한 파일럿 실험에서 대다수의 사용자가 결과 코드의 정확도를 65% 이상으로 평가했으며, 코드의 대부분이 Codex에서 생성되었습니다. 딜로이트의 실험 결과, 관련 프로젝트의 코드 개발 속도가 전반적으로 20% 개선된 것으로 나타났습니다. 또한 딜로이트는 코드를 한 언어에서 다른 언어로 번역하는 데에도 Codex를 사용했습니다. 딜로이트의 결론은 당분간은 여전히 전문 개발자가 필요하겠지만, 생산성이 향상되면 그 수가 줄어들 수 있다는 것이었습니다. 다른 유형의 생성 AI 도구와 마찬가지로, 프롬프트가 좋을수록 출력 코드가 더 좋다는 사실을 발견했습니다.

대화형 애플리케이션

대화형 AI 또는 챗봇의 핵심에 LLM이 점점 더 많이 사용되고 있습니다. LLM은 잠재적으로 현재의 대화 기술보다 더 높은 수준의 대화 이해와 문맥 인식을 제공할 수 있습니다. 예를 들어, 대화용으로 설계된 Facebook의 BlenderBot은 문맥을 유지하면서 사람과 긴 대화를 이어갈 수 있습니다. Google의 BERT는 검색 쿼리를 이해하는 데 사용되며, 이 회사의 DialogFlow 챗봇 엔진의 구성 요소이기도 합니다. 또 다른 LLM인 Google의 LaMBA 역시 대화를 위해 설계되었으며, 이 머신러닝과 대화한 엔지니어 중 한 명은 이 머신러닝이 단순히 과거 대화를 기반으로 대화에 사용될 단어를 예측한다는 점을 감안할 때 지각이 있는 존재라고 확신할 수 있었습니다.

이 인공 지능 중 누구도 완벽한 대화 상대는 없습니다. 과거의 인간 콘텐츠에 대한 훈련을 받았기 때문에 훈련 과정에서 노출된 인종 차별적, 성 차별적, 편향된 언어를 그대로 따라하는 경향이 있습니다. 이러한 시스템을 만든 회사들이 혐오 발언을 걸러내기 위해 노력하고 있지만 아직 완전히 성공하지는 못했습니다.

관련 글  Stability AI, StableLM 출시

지식 관리 애플리케이션

LLM의 새로운 응용 분야 중 하나는 조직 내에서 텍스트 기반(또는 잠재적으로 이미지 또는 동영상 기반) 지식을 관리하는 수단으로 사용하는 것입니다. 구조화된 지식 베이스를 만드는 데 드는 노동 집약성으로 인해 많은 대기업에서 대규모 지식 관리가 어려웠습니다. 그러나 어떤 연구에 따르면 조직 내 특정 텍스트 기반 지식에 대해 모델 학습을 세밀하게 조정할 경우 LLM이 조직의 지식을 관리하는 데 효과적일 수 있다고 합니다. LLM 내의 지식은 프롬프트로 발행된 질문을 통해 액세스할 수 있습니다.

일부 기업에서는 선도적인 상용 LLM 제공업체와 함께 LLM 기반 지식 관리에 대한 아이디어를 모색하고 있습니다. 예를 들어, 모건 스탠리(Morgan Stanley)는 자산 관리 콘텐츠에 대한 교육을 미세 조정하여 재무 설계사가 회사 내에서 기존 지식을 검색하고 고객을 위한 맞춤형 콘텐츠를 쉽게 만들 수 있도록 OpenAI의 GPT-3와 협력하고 있습니다. 이러한 시스템 사용자는 효과적인 프롬프트를 작성하기 위해 교육이나 지원이 필요할 것으로 보이며, LLM의 지식 결과물은 적용하기 전에 여전히 편집이나 검토가 필요할 수 있습니다. 그러나 이러한 문제가 해결된다고 가정하면 LLM은 지식 관리 분야에 다시 불을 지피고 훨씬 더 효과적으로 확장할 수 있을 것입니다.

딥페이크 및 기타 법적/윤리적 문제

우리는 이미 이러한 생성 AI 시스템이 여러 가지 법적, 윤리적 문제를 빠르게 야기하는 것을 보았습니다. ‘딥페이크’, 즉 AI에 의해 만들어져 사실적인 것처럼 보이지만 실제로는 그렇지 않은 이미지와 동영상은 이미 미디어, 엔터테인먼트 및 정치 분야에서 발생하고 있습니다. 하지만 지금까지는 딥페이크 제작에 상당한 수준의 컴퓨팅 기술이 필요했습니다. 하지만 이제는 거의 모든 사람이 딥페이크를 만들 수 있게 되었습니다. OpenAI는 각 DALL-E 2 이미지에 고유한 기호를 ‘워터마킹’하여 가짜 이미지를 제어하려고 시도했습니다. 그러나 앞으로는 특히 생성 비디오 창작이 주류가 되면서 더 많은 제어가 필요할 것으로 보입니다.

또한 생성 AI는 무엇이 독창적이고 독점적인 콘텐츠를 구성하는지에 대한 수많은 의문을 제기합니다. 생성된 텍스트와 이미지는 이전의 어떤 콘텐츠와도 완전히 같지 않기 때문에 이러한 시스템 제공업체는 이러한 콘텐츠가 즉각적인 제작자의 소유라고 주장합니다. 그러나 이러한 텍스트와 이미지는 모델 학습에 사용된 이전 텍스트와 이미지에서 파생된 것이 분명합니다. 말할 필요도 없이 이러한 기술은 향후 몇 년 동안 지적 재산권 변호사에게 상당한 일거리를 제공할 것입니다.

이러한 몇 가지 비즈니스 적용 사례를 통해 우리는 이제 생성 AI가 조직과 조직 내 사람들을 위해 할 수 있는 일의 표면만 긁어모으고 있다는 것을 분명히 알 수 있습니다. 예를 들어, 이러한 시스템이 이메일, 편지, 기사, 컴퓨터 프로그램, 보고서, 블로그 게시물, 프레젠테이션, 비디오 등의 초안을 작성하는 등 서면 또는 이미지 기반 콘텐츠의 대부분 또는 전부를 작성하는 것이 곧 표준 관행이 될 수 있습니다. 이러한 기능의 발전은 콘텐츠 소유권과 지적 재산권 보호에 예상치 못한 큰 영향을 미칠 것이 분명하지만, 지식과 창의적인 작업에도 혁명을 일으킬 가능성이 높습니다. 이러한 인공지능 모델이 지금과 같은 속도로 계속 발전한다고 가정할 때, 인공지능이 가져올 기회와 영향은 상상하기조차 어렵습니다.

Series Navigation<< 생성 AI를 아주 쉽게 설명한다면생성 AI: 창의적인 새로운 세상 >>
태그:

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다