Microsoft, 사진 편집을 도와주는 Visual ChatGPT 출시

개요

Microsoft는 AI를 사용하여 이미지에 캡션을 생성하여 시각 장애가 있는 사람들이 콘텐츠를 더 쉽게 이해할 수 있도록 하는 혁신적인 도구인 Visual ChatGPT를 출시했습니다.

이 도구는 채팅 중에 이미지를 주고받을 수 있도록 ChatGPT와 여러 비주얼 파운데이션 모델을 연결하여 사용자가 보다 상호 작용적이고 매력적인 대화 경험을 할 수 있게 해줍니다.

마이크로소프트가 또 해냈습니다! 최신 발명품인 비주얼 ChatGPT를 방금 출시했습니다. 이 놀라운 소프트웨어는 사용자가 사진에서 직접 모든 물체를 깔끔하게 제거할 수 있게 해줍니다. Visual ChatGPT는 AI를 사용하여 이미지에 캡션을 생성하는 혁신적인 도구로, 시각 장애가 있는 사람들이 콘텐츠를 더 쉽게 이해할 수 있도록 도와줍니다. 이 새로운 발명품으로 Microsoft는 이미지 인식 기술의 한계를 뛰어넘고 있습니다.

Visual ChatGPT는 채팅 중 이미지를 주고받을 수 있도록 ChatGPT와 여러 Visual Foundation 모델을 연결합니다. 이 기능을 통해 사용자는 토론 중인 주제와 관련된 이미지를 공유할 수 있어 보다 상호작용적이고 매력적인 대화 경험을 할 수 있습니다. 또한 텍스트보다 시각적 보조 자료를 통해 자신을 표현하는 것이 더 쉬운 사람들을 위해 커뮤니케이션을 향상시킵니다.

이 비디오는 사진이 오토바이임을 인식하고, 오토바이가 어디에 있는지 이해하고, 심지어 색상을 정확하게 결정한다는 것을 보여줍니다. 예를 들어이 오토바이의 색상을 변경할 수 있습니다. 이 기술은 물체와 그 특성을 인식 할 수있는 인공 지능과 컴퓨터 비전 알고리즘을 사용하여 가능합니다. 이는 다양한 산업 분야에서 커스터마이징 및 개인화를 위한 광범위한 가능성을 열어줍니다.

ChatGPT는 다양한 프롬프트와 질문에 대해 일관되고 문법적으로 정확한 응답을 생성하기 위해 방대한 텍스트와 인간 상호 작용에 대해 학습된 언어 모델입니다. OpenAI의 라이브러리와 드론 인터페이스를 통합하여 드론과 로봇을 자체적으로 제어할 수 있습니다. Microsoft는 ChatGPT가 텍스트를 넘어서서 자신의 행동이 실제 세계와 가상 세계에 어떤 영향을 미칠 수 있는지 고려하여 인간의 다양한 작업을 지원할 수 있는지 살펴봤습니다.
메타는 ‘창의적이고 표현적인 도구’를 구축하고 다양한 방식으로 사람들을 도울 수 있는 ‘AI 페르소나’를 개발하는 데 초점을 맞춘 새로운 제품 그룹을 만들고 있습니다. 메타는 생성 AI에 투자하고 있지만, 두 개의 AI 챗봇인 갤럭티카와 블렌더봇은 부정적인 피드백을 받고 있습니다.
엘론 머스크는 ChatGPT의 라이벌을 만들기 위해 팀을 구성하고 있으며, 전 OpenAI 직원이자 구글의 AI 연구소인 딥마인드의 수석 연구 엔지니어였던 이고르 바부슈킨이 이 팀에 합류한 것으로 알려졌습니다.