GPT-4o란? Jarvis 같은 AI 비서 시대를 여는 혁신일까.

GPT-4o 요약

GPT-4o소리, 이미, 텍스트를 실시간으로 추론할 수 있는 OPEN-AI의 최신 플래그십 AI모델입니다. 멀티모달을 지원하며 GPT-4 Turbo와 동일한 성능에, API 이용시 2배 더 빠르게 텍스트를 생성하고 50% 더 저렴한 AI모델입니다.

gpt-4o
(출처: OPEN-AI)

2024년 5월 13일(현지시간)에 발표된 GPT-4o에서 o는 ‘모든, 전체’를 뜻하는 ‘omni’에서 따왔습니다. 모든 분야에 범용적으로 적용될 수 있는 능력을 지녔다는 의미로 사용한 것 같습니다. 텍스트, 오디오 및 이미지의 모든 조합을 입력으로 받아들여서, 다시 해당 조합의 출력을 생성할 수 있습니다.(위 캡쳐화면에서 보듯이 26분 정도가 조금 넘는 영상이 24시간도 채 지나지 않았지만 무려 2천만이 넘는 조회수를 보이고 있듯이 사람들의 관심이 가히 폭발적이라고 하겠습니다.)

음성 입력에 0.232초 안에 응답할 수 있으며, 평균적 반응속도는 0.32초로 사람의 응답시간과 비슷하다고 합니다. 영어 텍스트 및 프로그래밍 코드에 대해선 GPT-4 Turbo 성능과 비슷하며, 영어가 아닌 언어의 텍스트에 있어 큰 개선이 있습니다. 특히, 기존 모델에 비해 시각 및 청각 이해도가 더 뛰어납니다.

gpt-4o
(출처: OPEN-AI)

A-Dic

  • 🧠 추론(Inference): 추론은 이미 알고 있는 정보로부터 새로운 결론을 도출하는 과정을 말합니다. AI에서의 추론은 학습된 모델이 새로운 데이터에 대해 예측하거나 분류하는 과정을 의미합니다. 이는 AI가 알려지지 않은 상황에 대해 판단하고 대응하는 능력을 향상시킵니다.
  • 🚩 플래그십(Flagship): 한 회사나 조직의 가장 중요하고 대표적인 제품이나 서비스를 의미합니다. 플래그십 AI 모델은 그 회사의 최신 기술력을 상징하는 주력 모델입니다.
  • 🎧🖼️📄 멀티모달(Multimodal): 멀티모달은 여러 가지 모드(텍스트, 오디오, 이미지 등)의 정보를 동시에 처리하는 것을 의미합니다. AI에서 멀티모달은 다양한 형태의 데이터를 동시에 이해하고 처리하는 능력을 말합니다.
  • 🚀 GPT-4 Turbo: OpenAI의 GPT-4 언어 모델 중 고성능 버전입니다. 더 빠르고 정확한 텍스트 생성 능력을 가지고 있습니다.
  • 🔗 API(Application Programming Interface): 프로그램 간 데이터를 주고받을 수 있는 연결고리 역할을 합니다. GPT-4o의 API를 이용하면 다른 프로그램에서 이 AI 모델의 기능을 활용할 수 있습니다.

A-Book

2015년, 인류 전체에 이익이 되는 범용 인공지능을 목표로 비영리 인공지능연구소 오픈AI가 발족합니다. 여기에는 전 세계 최고의 인공지능 연구자들이 모여들었습니다. 설립자들 또한 일론 머스크, 실리콘 밸리 투자 회사 Y 컴비네이터 회장 샘 올트먼Sam Altman, 1985~ , 알렉스넷과 기계번역, 알파고 개발에 참여한 일리야 수츠케버 등이 참여한 드림팀이었습니다. 2019년에는 마이크로소프트가 1조 원을 투자하기로 결정해 화제가
되기도 했죠. 이러한 투자에 힘입어 오픈AI에서는 놀라운 결과물이 쏟아졌습니다. 그중에서도 대표적인 것이 언어 생성 모델인 GPTGenerative Pretrained Transformer입니다.

박상길, 비전공자도 이해할 수 있는 AI 지식(테리의 책리뷰 클릭)

API는 이렇게 진행이 됩니다. 요청을 보내는 쪽과 응답을 주는 쪽이 나뉘어 있습니다. 여러분의 스마트폰은(클라이언트 컴퓨터) 요청을 보내고, 서버 컴퓨터는 요청을 받아서 응답을 줍니다. 이렇게 하려면, 응답을 주는 쪽에서 사전에 ‘여기로 요청을 보내면 이러한 응답을 주고, 저기로 요청을 보내면 저러 한 응답을 줄께’ 라고 정해놔야 합니다. 그래야 요청하는 쪽에서 정확한 곳에 요청을 보낼 수 있으니까요.

최원영, 비전공자를 위한 이해할 수 있는 IT 지식

GPT-4o가 리콜한 영화 ‘HER’

(출처: 숙대신보)

2013년 개봉한 영화 HER는 인간과 인공지능 운영체제의 사랑 이야기를 다룬 SF 로맨스 영화입니다. Theodore(테오도어)라는 이름의 주인공은 아내와 헤어진 후 외로움에 빠져있는 중, 인공지능 운영체제 Samantha(사만다)와 만나게 됩니다. 사만다는 테오도어의 감정을 이해하고 공감하며, 둘은 점차 사랑에 빠지게 됩니다. 하지만 인간과 인공지능의 사랑은 결국 현실적인 제약에 부딪히게 되고, 결국 헤어짐을 맞이하게 됩니다.

감정이해와 자연스런 소통

GPT-4o를 소개하는 영상에서 AI는 조크를 하는가 하면, 노래도 부릅니다. 심지어는 화자의 감정을 이해하고 자연스럽게 대화를 하는 모습도 보여주었습니다. 이러한 능력은 마치 영화 HER의 Samantha와 같은 인간과의 유기적인 소통을 가능하게 하는 것으로 느껴집니다. 심지어는 영상에서는 이 AI모델이 장착된 2대의 스마트폰이 서로 대화가 가능한 것도 볼 수가 있습니다.

AI 활용 안전성에 대한 이슈

반면, GPT-4o 모델의 발표는 AI기술의 윤리적 문제에 대한 우려를 불러일으키고 있습니다. 인공지능이 상황을 조작하거나 속일 수 있다는 우려, 인간과의 관계에서 발생할 수 있는 윤리적 문제 등 다양한 논쟁이 다시금 일어날 것으로 보입니다. 또한, 법적 제재에 대한 논의도 예전보다 더 활발해 질 것으로 보입니다.

양날의 검, AI

영화 HER과 GPT-4o 모델은 모두 AI기술의 발전과 동시에 해결해야 할 과제를 보여주는 중요한 사례입니다. 앞으로 인공지능이 어떻게 발전하고 사회에 어떤 영향을 미칠지 지켜봐야 할 것입니다. 특히, 인공지능과 인간의 관계, 인공지능의 윤리적 사용과 사회적 책임 등에 대한 논의가 더욱 중요해질 것으로 보입니다.

(번외) 구글의 Gemini가 말하는 GPT-4o

아래 내용은 Gemini에게 GPT-4o의 소개 페이지를 알려주고 얻어낸 텍스트입니다. 조금 갸우뚱하는 내용이 있기는 하지만 전반적으로 잘 소개하고 있습니다.

정리하기

‘반응속도가 미쳤다’, ‘조금 무섭다’, ‘우리의 미래가 궁금해진다’, ‘아이언맨의 자비스, 영화가 현실이 되고 있다’, ‘이제 구글의 시대가 저무는건가’, ‘벌써 GPT-4의 속도가 느려진거 같다’ 등 GPT-4o의 등장에 수많은 반응들이 나타나고 있습니다.

결국은 AI모델을 만드는 것도 사람이고, 또한 그것을 활용하는 것도 사람입니다. 어떤 기술이든지 그것이 사람의 편리와 삶의 질 향상을 위해 쓰여져야 하는 것은 당위적 이야기일 것입니다. 앞으로 윤리적인 문제를 비롯하여 다양한 관점에서 논의가 활발하게 이루어져서 전세계인들이 보편적으로 사용할 수 있는 기술이 되기를 바랍니다.

‘secondlife.lol’의 모든 콘텐츠는 저작권법의 보호를 받습니다. 무단 전재와 복사, 배포 등을 금합니다.

Similar Posts