미래유망직업
[전문가칼럼] 대화형 인공지능 기술의 현재와 미래
#여성과학기술인#대화형인공지능#chatgpt#엑소브레인
조회수 2412
좋아요4
작성일2023-08-16
[전문가칼럼] 대화형 인공지능 기술의 현재와 미래

한국전자통신연구원(ETRI) 초지능창의연구소 민옥기 소장
2010.8. 충남대학교 컴퓨터공학과 박사
1988.2.1.~ 현재 ETRI 책임연구원
2007.08.~2008.07. Wright State Univ. 방문연구원
2008.8.~2011.2. ETRI, SW서비스연구팀 책임연구원
2011.2.~2015.5. ETRI, SW미래연구팀 팀장
2015.6.~2016.12. ETRI, 데이터분석SW연구실 실장
2017.01.~2019.06. ETRI, 스마트데이터연구그룹 그룹장
2019.07.~ 2023.01. ETRI, 지능정보연구본부 본부장
2023.02.~ 현재 ETRI, 초지능창의연구소 소장
1) 한국의 챗 GPT, 엑소브레인
우리나라의 대화형 인공지능의 수준은 어디까지 왔을까?
한국전자통신연구소에는 초지능창의연구소가 있다. 이 곳은 우리나라 인공지능 기술의 국가 경쟁력을 견인하기 위한 폭넓은 연구가 이루어지는 곳이다. 우리나라의 대화형 인공지능 '엑소브레인'도 여기에서 탄생했다. 엑소브레인은 오픈 API(aiopen.etri.re.kr)를 국내에 공개해 토종 인공지능 기술이 자리 잡을 수 있도록 했다. 외국의 인공지능 솔루션 시장의 잠식에 대응할 한국의 인공지능 원천기술이다.
엑소브레인은 한국어 기반의 인공지능이기 때문에 한국에서는 챗GPT, 바드(Bard)보다 더 정확한 답을 얻을 수 있다.
한국전자통신연구원은 대화형 외국어(영어 또는 한국어) 교육 시스템도 개발했다. 외국어를 배우는 대화형 인공지능 시스템은 국내 공교육에 이미 적용 중이고, 해외로도 서비스하고 있는데 특히 동남아권에서 많이 활용되고 있다.

엑소브레인을 적용한 법률 QA 시스템

AI 대화기술을 활용한 영어교육시스템과 한국어 교육 인공지능
2) 대화형 인공지능 모델의 문제점 ‘할루시네이션(Hallucination)’
현재 대화형 대형언어모델이 대부분 트랜스포머 알고리즘을 기반으로 한다. 트랜스포머는 태생적으로 정확성을 목적으로 하는 것이 아니고, 뒤에 이어지는 문장이나 단어가 얼마나 자연스럽게 오는지에 대한 확률로 찾으므로, 정확한 답이 아닐 확률 역시 필연적으로 가지고 있다. 여기에 학습을 위해 모아진 데이터에 잘못된 지식이 포함될 가능성이 있으며, 대형언어모델의 지식이 학습된 시점을 기준으로 정체되어 있기 때문에 학습 시점 이후에 변경되었거나 새로 만들어진 지식을 반영하지 못하는 문제점도 가지고 있다.
“할루시네이션(Hallucination: 환각, 환영 등을 뜻하는 단어로 주어진 데이터 또는 맥락에 근거하지 않은 잘못된 정보나 허위 정보를 생성하는 것)”이라고 명명된 이 문제점 해결과 잘못된 답의 확률을 줄이기 위해서 현재 기업들은 데이터를 확인하거나 사람이 피드백을 주는 강화학습(RLHF: Reinforcement Learning Human Feedback)을 하고 있다. 그러나 확률을 줄일 뿐 원천적인 해결책이 되지는 못한다. 이 문제 해결을 위해서는 트랜스포머를 대체하여 할루시네이션(Hallucination) 문제를 해결할 새로운 알고리즘을 개발하거나, 인공지능이 생성한 문장 결과에 대한 데이터 출처를 제시하여 사람이 판단할 수 있도록 하는 방법이 있다.
현재 ETRI에서도 정확성과 신뢰도 향상을 위하여 전문지식의 판단 결과에 대한 이유와 근거를 제시하는 전문가 의사결정 지원 인공지능 기술을 개발 중이다. 정확성을 위하여 답변 시점의 외부 지식을 반영할 수 있는 기술도 같이 개발 중이다.
3) 대화형 인공지능, 일하는 방식을 혁신할 것
극복해야 할 한계점도 있지만 인공지능은 미래에 빠질 수 없는 핵심 기술이다. 그중에서도 가장 두각을 나타내는 것을 전문 분야의 보조 기능일 것이다. 대화형 인공지능의 특징이 가진 유창함으로 문장 구성의 초안을 잡을 때 활용 가능성이 높다.
예를 들어 소설의 형식 초안을 잡거나, 보고서나 연설문의 구성을 잡을 때도 사용될 것이다. 많은 사람의 창작활동에 영향을 주며, 출판물이나 소셜 미디어에 인공지능으로 만들어진 생성물이 등장하고, 비즈니스 활동에도 많은 도움을 주게 될 것이다. 그리고 교육, 법률 분야 등 전문 분야에서도 주제와 연관된 기초지식을 얻을 때 일차적인 정보 확보로 많이 활용될 것으로 보인다. 그리고 앞에서도 소개했듯이 외국어 공부를 하면서 AI 도움을 많이 받을 수도 있을 것이다. 일련의 보고서에서는 의료·헬스케어 분야가 영향을 많이 받을 것으로 표현하는데 의료법에 따라 국가별로 차이가 있을 것으로 보인다. 그러나 어느 분야에 활용되든 대화형 인공지능이 가지는 부정확성으로 완전히 사람을 대체한다고 보기는 어렵고, 전문가의 업무를 경감시켜 주는 보조기능으로 활용될 것으로 생각된다.
4) 생성형 인공지능이 만들어낸 새로운 직업 3가지
프롬프트 엔지니어(prompt engineer)
OpenAI의 GPT 계열 모델이나 구글의 람다(LAMDA), 메타의 OPT와 같은 대규모 언어모델을 활용하여 원하는 응용/서비스를 만드는 작업을 프롬프트라고 하는데, 현재 현장에서는 대형언어모델의 동작 원리와 데이터, 그리고 언어모델 API를 이해할 수 있는 프롬프트 엔지니어를 많이 필요로 하고 있다. 프롬프트 엔지니어는 기본모델을 활용하는 제로샷-퓨샷(Zero-shot/Few-shot) 프롬프팅, 답변 과정을 학습시키는 CoT(Chain of Throught) 프롬프팅, 답변의 일관성을 유지시키는 자가일치성(Self-Consistency) 프롬프팅, 관련지식을 제공하는 지식 프롬프팅(Knowlege Prompting)으로 나뉠 수 있다.
데이터 사이언티스트(Data scientist)
데이터 엔지니어가 단순히 데이터 라벨링을 하는 인력을 의미했다면, 데이터 사이언티스트는 데이터 엔지니어를 포함해서 좀 더 확대해 볼 수 있을 것으로 생각한다. 단순한 라벨러를 뛰어넘어 문제를 유발할 수 있는 데이터를 식별하거나 대화형 언어 인공지능이 생성해 낸 문장의 정확성과 유창함, 질적인 문장 수준을 평가하여 피드백해 줄 수 있는 인력도 의미할 수 있다.
인공지능 융합 아키텍트(architect)
다학제간의 융합이 가능한 인공지능 융합 아키텍트(architect)가 필요할 것이다. 가령, 대형언어모델을 활용하여 전문분야를 추가로 학습할 필요가 있거나 특수목적으로 응용을 구성한다면 해당 영역(법률, 의료/헬스케어, 회계, 경제, 투자 등등)의 언어에 대한 전문성을 이해할 수 있어야 하며, 이러한 전문성과 연결하여 어떤 시스템을 구성할지를 판단해야 한다. 인공지능 융합 아키텍트는 꼭 개인의 직업이 아닌, 다학제를 아우르고 문제를 풀어나갈 수 있는 팀으로도 볼 수 있다.
5) 생성형 인공지능 시대에 필요한 인재
생성형 인공지능은 현재가 끝이 아니라 시작점이라고 해도 과언이 아니다. 예를 들어, 10년 뒤에 생성형 인공지능이 탑재된 개인화된 로봇을 생각해 보자. 나에게 도움을 주는 로봇은 내 주변에 있는 상황을 이해하고, 나의 과거 습관과 행적들을 이해하고 그에 맞는 대화를 이어 나갈 수 있어야만 하지 않을까? 현재와 같은 단순히 포괄적인 대화형 문장 생성이 아닌, 회의내용과 맞는, 현재 장소에 맞는, 주변 인물과의 토론내용과도 부합하는 그러한 문장을 생성해 내는 대화형 인공지능을 기대해 본다.
10년 뒤의 인공지능 시장은 소셜 로봇이나 온라인상의 디지털 휴먼과 접목되거나 각 산업도메인에 접목되어 지속적으로 팽창될 것으로 생각된다. 이때 필요한 직업군은 다양할 것이다.
첫 번째, 각 도메인과 인공지능을 동시에 이해하고 지속적으로 업그레이드해 나갈 수 있는 인공지능 융합 전문가, 두 번째, 현재 인공지능의 확장으로 행동 지능, 교감 지능 및 인공지능의 한계 극복이나 뇌인지 모사 등 새로운 알고리즘을 개발할 수 있는 인공지능 연구자, 세 번째, 앞서 이야기했듯이 인공지능 기술을 통합하여 인공지능 로봇, 말하는 자동차, 디지털 휴먼 등을 지속적으로 발전시켜나갈 통합 인공지능 전문가, 마지막으로 인공지능 기술 개발을 위하여 저탄소 소재, 저탄소 컴퓨팅 부품, 저탄소 컴퓨팅 운영 등 인공지능 인프라 개발과 관리자 등과 같은 인력이 필요할 것으로 생각한다.
무엇보다 인공지능의 핵심은 ‘융합적 사고’다. 그동안 많은 인력과 일 해본 경험에 비추어 보건대 우리나라 인력의 아쉬운 점은 토론에 약하다는 것이다. 인공지능의 파급은 산업계와 학계 등 모든 분야와 접목했을 때 그 의의가 배가되는데, 타 분야에 인공지능을 적용하기 위해서는 적용 도메인 전문가와 인공지능 전문가와의 토론을 통해 최적의 융합 점을 찾아야만 한다. 이 과정에서 우리는 서로의 지식에 함몰되어 상대방의 지식에 다가가기 어렵기 십상이다. 긴 토론으로 상호 생소한 분야에 있는 지식과 접점을 이해하여 해당 전문 분야에 인공지능을 적용하는 것은 IT 서비스 이상의 혁신을 가져올 것이다.
인공지능 분야의 전문가가 되고 싶다면 토론을 즐기고, 다양한 분야를 융합하는데 능통하도록 열린 사고를 연습하길 바란다.