오픈(Open) AI 사가 GPT-3.5라는 인공지능 모델 기반의 대화 전문 인공지능 챗봇(Chatbot)인 챗GPT를2022년 11월 30일에 전격적으로공개한 이후 전 세계는 신선하면서도 놀라운 충격과 화제로 휩싸였습니다.
이 번 글에서는 오픈 AI 사의 인공지능 챗봇, 챗GPT에 대해서 자세하지만 이해하기 쉽도록 알아보겠습니다.
챗GPT 이력
오픈 AI 사는 현재 CEO인 샘 올트먼과 일론 머스크 테슬라 CEO 등이 2015년에 설립한 비영리 단체로 디지털 지능 개발이 목표였습니다.GPT-3,GPT-3.5의 개발성공과 공개에 이어 2023년에는 인간의 신경망과 유사한 수준의 GPT-4를 내놓는다는 계획까지 발표하였으나 일론 머스크는 지분을 오래전에 팔았고 현재는 마이크로소프트가 최대 주주입니다.
챗GPT는 GPT-3.5 공개 후 2023년 1월 월간 사용자 수가 1억 명을 돌파하는 놀라운 성장세를 보였으며 발 빠르게 챗GPT의 유료 버전인 챗GPT 플러스(ChatGPT Plus)를 2023년 2월에 출시하였습니다.이러한 상황을 직면한 구글은 위기감을 느끼고 대화형 AI 서비스인 바드(Bard) 출시를 공식화하였으며 마이크로소프트도 검색 엔진 빙(Bing)에 챗GPT 기반의 언어모델을 탑재하고 검색시장 주도권을 차지하기 위한 본격적인 글로벌 경쟁에 불을 붙였습니다.
인공지능 기술 AI의 핵심인 머신 러닝(Machine Learning)과 딥 러닝(Deep Learning) 기술을 사용하는 챗봇(Chatter Robot)은 사람과 상호 작용하는 컴퓨터 프로그램으로 사용자가 입력한 질문에 대해 답변을 제공하고 대화를 하는 기술로 이메일, 웹 사이트, 소셜 미디어, 모바일 앱 등 이미 다양한 분야에 광범위하게 적용되고 있습니다.
그러나 챗GPT(Generative Pre-trained Transformer)는 수백만 개의 웹페이지로 구성된 데이터베이스에서 미리 훈련된(Pre-trained) 대량 생성(Generative) 변환기(Transformer)를 통해 사람과 자연스러운 대화를 하고 그 과정에서 입력되는 피드백을 통해 스스로 학습을 강화하는 알고리즘을 보유하고 있습니다.
따라서 챗GPT는 이전 대화를 기억하고 그 속에 숨은 맥락을 이해하며 단순히 요청받은 지식이나 정보 전달을 위한 대화뿐만 아니라 창의적 아이디어나 기술적 문제의 새로운 해결방안을 제시하여 논문 작성, 번역, 노래 작사와 작곡, 코딩 작업 등의 훨씬 더 폭넓은 분야에서 서비스를 제공할 수 있는 것입니다.
인공지능 용어 이해
여기서 잠깐 이해를 돕기 위해 인공지능 AI(Artificial Intelligence)와 관련된 몇 가지 주요 용어에 대해 추가 설명을 하도록 하겠습니다.
인공지능 AI의 핵심 기술은 앞에서도 얘기한 바와 같이 머신 러닝과 딥 러닝입니다. 딥 러닝은 머신 러닝의 한 분야로조금 더 발전한 기술이지만 서로 보완적인 관계에 있습니다.
머신 러닝은 작은 규모의 데이터로도 효과적인 결과를 얻을 수 있으며 상대적으로 단순한 모델과 알고리즘을 통해 사전에 설정된 과제를 달성하는 기술입니다.
따라서 머신 러닝은 딥 러닝보다는 상대적으로 좁은 범위의 분야에서 사용되며 다양한 추천 시스템, 이상 감지, 데이터 분류 등의 문제를 해결하는 데 주로 사용됩니다.
반면 딥 러닝은 여러 층으로 구성된 인공 신경망(Artificial Neural Networks)을 통해 방대한 크기의 빅데이터를 분석하고 이해한 결과를 바탕으로 과제를 해결하는 방법으로 훨씬 복잡한 모델을 사용하며 입력 값과 각 신경망 사이의 가중치를 조절하여 정확도를 높이는 기술입니다.
따라서 딥러닝은 이미지, 음성, 자연어 처리 등 다양한 분야에서 널리 사용되며 오픈 AI 사의 챗GPT도 이러한 딥러닝을 기반으로 구현된 자연어 처리 AI 모델 중 하나입니다.
챗GPT는 대규모의 웹 데이터 즉 빅테이터를 기반으로 자연어 이해와 생성, 질의응답 등 다양한 자연어 처리 기능을 수행할 수 있는 인공지능인 것입니다.
인공신경망은 생물의 신경망에서 영감을 받아 설계된 알고리즘으로 입력층(Input layer), 은닉층(Hidden layer), 출력층(Output layer) 등으로 구성되는데 특히 딥러닝에서는 은닉층(Hidden layer)을 여러 개 쌓아 올리는 방식을 사용합니다.
이렇게 쌓인 여러 개의 은닉층을 딥 뉴럴 네트워크(Deep Neural Network)라고 부르며 생물의 신경 세포와 같은 역할을 하는 뉴런(Neuron)이 기본 단위로 연결되어 입력에 대한 출력을 생성합니다.
챗GPT의 한계
- 챗GPT는 2021년까지의 웹 데이터를 기반으로 하고 있어 그 이후의 정보는 물론 최근 정보는 가지고 있지 않습니다.
- 필자도 챗GPT와의 직접 채팅에서 몇 번 경험해 보았지만 정확하지 않거나 틀린 내용을 마치 입증된 사실인 것처럼 답변하는 경우가 간혹 있어 주요 정보는 반드시 재확인이 필요합니다.
- 챗GPT가 MBA, 로스쿨, 의사면허 시험까지 통과하면서 화이트칼라 일자리에 큰 영향을 줄 것이라는 우려도 있지만 그 보다 더 큰 문제는 방대한 양의 전문 지식을 담은 에세이와 논문을 순식간에 써 내려가는 능력으로 인해 발생하는 다양한 표절 이슈입니다. 학생들의 과제에서 학계의 논문, 창작물에 이르기까지 표절에 대한 명확한 기준과 법제도가 마련되지 않는다면 사용에 큰 제약이 발생할 수밖에 없습니다.
- 끝으로 챗GPT의 방대한 데이터와 코딩 기능을 조합하고 악용하여 불법 사이트나 악성 프로그램을 개발하는 데에 활용되는 문제도 심각할 수 있습니다.
챗GPT 사용 방법
현재 여러 가지 한계나 문제점은 있지만 점차 보완하고 더욱 발전해 나갈 것이므로 인공지능이 대세가 되는 트렌드는 막을 수 없을 것으로 생각됩니다.
아직 챗GPT를 경험하지 못한 분들을 아래를 참조하시기 바랍니다.우선 오픈 AI 사의 홈페이지의 챗 페이지https://chat.openai.com/chat으로 이동합니다.
위 그림의 왼쪽과 같이 로그인 창이 나타나면 기존 구글이나 마이크로소프트 계정을 이용해서 로그인하면 됩니다.
로그인이 완료되면 오른쪽과 같은 화면이 표시되는데 하단의 빈칸에 묻고 싶은 내용을 한글이나 영어로 입력하고 엔터를 누르면 잠시 후 답변이 그 아래에 나타나게 됩니다.