한국여성과학기술인육성재단 W브릿지

과학기술 트렌드

미래유망직업

[전문가칼럼] 대화형 인공지능 기술의 현재와 미래

#여성과학기술인#대화형인공지능#chatgpt#엑소브레인

조회수 2412 좋아요4 작성일2023-08-16

좋아요추가하기

[전문가칼럼] 대화형 인공지능 기술의 현재와 미래

한국전자통신연구원(ETRI) 초지능창의연구소 민옥기 소장

2010.8. 충남대학교 컴퓨터공학과 박사
1988.2.1.~ 현재 ETRI 책임연구원
2007.08.~2008.07. Wright State Univ. 방문연구원
2008.8.~2011.2. ETRI, SW서비스연구팀 책임연구원
2011.2.~2015.5. ETRI, SW미래연구팀 팀장
2015.6.~2016.12. ETRI, 데이터분석SW연구실 실장
2017.01.~2019.06. ETRI, 스마트데이터연구그룹 그룹장
2019.07.~ 2023.01. ETRI, 지능정보연구본부 본부장
2023.02.~ 현재 ETRI, 초지능창의연구소 소장

1) 한국의 챗 GPT, 엑소브레인

우리나라의 대화형 인공지능의 수준은 어디까지 왔을까?

한국전자통신연구소에는 초지능창의연구소가 있다. 이 곳은 우리나라 인공지능 기술의 국가 경쟁력을 견인하기 위한 폭넓은 연구가 이루어지는 곳이다. 우리나라의 대화형 인공지능 '엑소브레인'도 여기에서 탄생했다. 엑소브레인은 오픈 API(aiopen.etri.re.kr)를 국내에 공개해 토종 인공지능 기술이 자리 잡을 수 있도록 했다. 외국의 인공지능 솔루션 시장의 잠식에 대응할 한국의 인공지능 원천기술이다.

엑소브레인은 한국어 기반의 인공지능이기 때문에 한국에서는 챗GPT, 바드(Bard)보다 더 정확한 답을 얻을 수 있다.

한국전자통신연구원은 대화형 외국어(영어 또는 한국어) 교육 시스템도 개발했다. 외국어를 배우는 대화형 인공지능 시스템은 국내 공교육에 이미 적용 중이고, 해외로도 서비스하고 있는데 특히 동남아권에서 많이 활용되고 있다.

엑소브레인을 적용한 법률 QA 시스템

AI 대화기술을 활용한 영어교육시스템과 한국어 교육 인공지능

2) 대화형 인공지능 모델의 문제점 ‘할루시네이션(Hallucination)’

현재 대화형 대형언어모델이 대부분 트랜스포머 알고리즘을 기반으로 한다. 트랜스포머는 태생적으로 정확성을 목적으로 하는 것이 아니고, 뒤에 이어지는 문장이나 단어가 얼마나 자연스럽게 오는지에 대한 확률로 찾으므로, 정확한 답이 아닐 확률 역시 필연적으로 가지고 있다. 여기에 학습을 위해 모아진 데이터에 잘못된 지식이 포함될 가능성이 있으며, 대형언어모델의 지식이 학습된 시점을 기준으로 정체되어 있기 때문에 학습 시점 이후에 변경되었거나 새로 만들어진 지식을 반영하지 못하는 문제점도 가지고 있다.

“할루시네이션(Hallucination: 환각, 환영 등을 뜻하는 단어로 주어진 데이터 또는 맥락에 근거하지 않은 잘못된 정보나 허위 정보를 생성하는 것)”이라고 명명된 이 문제점 해결과 잘못된 답의 확률을 줄이기 위해서 현재 기업들은 데이터를 확인하거나 사람이 피드백을 주는 강화학습(RLHF: Reinforcement Learning Human Feedback)을 하고 있다. 그러나 확률을 줄일 뿐 원천적인 해결책이 되지는 못한다. 이 문제 해결을 위해서는 트랜스포머를 대체하여 할루시네이션(Hallucination) 문제를 해결할 새로운 알고리즘을 개발하거나, 인공지능이 생성한 문장 결과에 대한 데이터 출처를 제시하여 사람이 판단할 수 있도록 하는 방법이 있다.

현재 ETRI에서도 정확성과 신뢰도 향상을 위하여 전문지식의 판단 결과에 대한 이유와 근거를 제시하는 전문가 의사결정 지원 인공지능 기술을 개발 중이다. 정확성을 위하여 답변 시점의 외부 지식을 반영할 수 있는 기술도 같이 개발 중이다.

3) 대화형 인공지능, 일하는 방식을 혁신할 것

극복해야 할 한계점도 있지만 인공지능은 미래에 빠질 수 없는 핵심 기술이다. 그중에서도 가장 두각을 나타내는 것을 전문 분야의 보조 기능일 것이다. 대화형 인공지능의 특징이 가진 유창함으로 문장 구성의 초안을 잡을 때 활용 가능성이 높다.

예를 들어 소설의 형식 초안을 잡거나, 보고서나 연설문의 구성을 잡을 때도 사용될 것이다. 많은 사람의 창작활동에 영향을 주며, 출판물이나 소셜 미디어에 인공지능으로 만들어진 생성물이 등장하고, 비즈니스 활동에도 많은 도움을 주게 될 것이다. 그리고 교육, 법률 분야 등 전문 분야에서도 주제와 연관된 기초지식을 얻을 때 일차적인 정보 확보로 많이 활용될 것으로 보인다. 그리고 앞에서도 소개했듯이 외국어 공부를 하면서 AI 도움을 많이 받을 수도 있을 것이다. 일련의 보고서에서는 의료·헬스케어 분야가 영향을 많이 받을 것으로 표현하는데 의료법에 따라 국가별로 차이가 있을 것으로 보인다. 그러나 어느 분야에 활용되든 대화형 인공지능이 가지는 부정확성으로 완전히 사람을 대체한다고 보기는 어렵고, 전문가의 업무를 경감시켜 주는 보조기능으로 활용될 것으로 생각된다.

4) 생성형 인공지능이 만들어낸 새로운 직업 3가지

프롬프트 엔지니어(prompt engineer)

OpenAI의 GPT 계열 모델이나 구글의 람다(LAMDA), 메타의 OPT와 같은 대규모 언어모델을 활용하여 원하는 응용/서비스를 만드는 작업을 프롬프트라고 하는데, 현재 현장에서는 대형언어모델의 동작 원리와 데이터, 그리고 언어모델 API를 이해할 수 있는 프롬프트 엔지니어를 많이 필요로 하고 있다. 프롬프트 엔지니어는 기본모델을 활용하는 제로샷-퓨샷(Zero-shot/Few-shot) 프롬프팅, 답변 과정을 학습시키는 CoT(Chain of Throught) 프롬프팅, 답변의 일관성을 유지시키는 자가일치성(Self-Consistency) 프롬프팅, 관련지식을 제공하는 지식 프롬프팅(Knowlege Prompting)으로 나뉠 수 있다.

데이터 사이언티스트(Data scientist)

데이터 엔지니어가 단순히 데이터 라벨링을 하는 인력을 의미했다면, 데이터 사이언티스트는 데이터 엔지니어를 포함해서 좀 더 확대해 볼 수 있을 것으로 생각한다. 단순한 라벨러를 뛰어넘어 문제를 유발할 수 있는 데이터를 식별하거나 대화형 언어 인공지능이 생성해 낸 문장의 정확성과 유창함, 질적인 문장 수준을 평가하여 피드백해 줄 수 있는 인력도 의미할 수 있다.

인공지능 융합 아키텍트(architect)

다학제간의 융합이 가능한 인공지능 융합 아키텍트(architect)가 필요할 것이다. 가령, 대형언어모델을 활용하여 전문분야를 추가로 학습할 필요가 있거나 특수목적으로 응용을 구성한다면 해당 영역(법률, 의료/헬스케어, 회계, 경제, 투자 등등)의 언어에 대한 전문성을 이해할 수 있어야 하며, 이러한 전문성과 연결하여 어떤 시스템을 구성할지를 판단해야 한다. 인공지능 융합 아키텍트는 꼭 개인의 직업이 아닌, 다학제를 아우르고 문제를 풀어나갈 수 있는 팀으로도 볼 수 있다.

5) 생성형 인공지능 시대에 필요한 인재

생성형 인공지능은 현재가 끝이 아니라 시작점이라고 해도 과언이 아니다. 예를 들어, 10년 뒤에 생성형 인공지능이 탑재된 개인화된 로봇을 생각해 보자. 나에게 도움을 주는 로봇은 내 주변에 있는 상황을 이해하고, 나의 과거 습관과 행적들을 이해하고 그에 맞는 대화를 이어 나갈 수 있어야만 하지 않을까? 현재와 같은 단순히 포괄적인 대화형 문장 생성이 아닌, 회의내용과 맞는, 현재 장소에 맞는, 주변 인물과의 토론내용과도 부합하는 그러한 문장을 생성해 내는 대화형 인공지능을 기대해 본다.

10년 뒤의 인공지능 시장은 소셜 로봇이나 온라인상의 디지털 휴먼과 접목되거나 각 산업도메인에 접목되어 지속적으로 팽창될 것으로 생각된다. 이때 필요한 직업군은 다양할 것이다.

첫 번째, 각 도메인과 인공지능을 동시에 이해하고 지속적으로 업그레이드해 나갈 수 있는 인공지능 융합 전문가, 두 번째, 현재 인공지능의 확장으로 행동 지능, 교감 지능 및 인공지능의 한계 극복이나 뇌인지 모사 등 새로운 알고리즘을 개발할 수 있는 인공지능 연구자, 세 번째, 앞서 이야기했듯이 인공지능 기술을 통합하여 인공지능 로봇, 말하는 자동차, 디지털 휴먼 등을 지속적으로 발전시켜나갈 통합 인공지능 전문가, 마지막으로 인공지능 기술 개발을 위하여 저탄소 소재, 저탄소 컴퓨팅 부품, 저탄소 컴퓨팅 운영 등 인공지능 인프라 개발과 관리자 등과 같은 인력이 필요할 것으로 생각한다.

무엇보다 인공지능의 핵심은 ‘융합적 사고’다. 그동안 많은 인력과 일 해본 경험에 비추어 보건대 우리나라 인력의 아쉬운 점은 토론에 약하다는 것이다. 인공지능의 파급은 산업계와 학계 등 모든 분야와 접목했을 때 그 의의가 배가되는데, 타 분야에 인공지능을 적용하기 위해서는 적용 도메인 전문가와 인공지능 전문가와의 토론을 통해 최적의 융합 점을 찾아야만 한다. 이 과정에서 우리는 서로의 지식에 함몰되어 상대방의 지식에 다가가기 어렵기 십상이다. 긴 토론으로 상호 생소한 분야에 있는 지식과 접점을 이해하여 해당 전문 분야에 인공지능을 적용하는 것은 IT 서비스 이상의 혁신을 가져올 것이다.

인공지능 분야의 전문가가 되고 싶다면 토론을 즐기고, 다양한 분야를 융합하는데 능통하도록 열린 사고를 연습하길 바란다.

[전문가칼럼] 트렌드를 읽는 생성형 인공지능(AI)

[기획] 생성형 인공지능(AI)의 윤리와 다양성

처리하는 개인정보의 항목 및 수집방법 표 입니다.
개인정보파일명	수집 목적	수집 항목	보유 및 이용기간
W브릿지 홈페이지 회원 정보	W브릿지 홈페이지 회원 운영	(필수) 이름, 생년월일, 주소, 핸드폰, 이메일	회원 탈퇴시 까지
뉴스레터 회원 정보	뉴스레터 발송 목적	(필수) 이메일	뉴스레터 탈퇴시 까지
여성과학기술인재아카데미 강사 명단	전문강사 POOL 등록 DB 관리	(필수) 이름, 핸드폰, 이메일, 소속, 직위, 경력기간, 전공, 학력	10년
여성과학기술인재아카데미 교육 수혜자 관리	교육 운영 관리 (이수증 및 자격증 발급)	(필수) 이름, 생년월일, 주소, 핸드폰, 이메일, 최종학력, 거주지, 경력단절기간, 해당분야 경력유무	10년
글로벌멘토링 참여자 명단	글로벌멘토링 사업수혜자 관리	(필수) 이름, 생년월일, 핸드폰, 이메일, 소속, 전공, 성별	10년
재직자멘토링 참여자 명단	사업 신청자 및 수혜자 관리	(필수) 이름, 생년월일, 핸드폰, 이메일, 소속, 부서, 직급	10년
취업탐색멘토링 참여자 명단	사업 신청자 및 수혜자 관리	(필수) 이름, 생년월일, 핸드폰, 이메일, 소속, 전공, 성별	10년
여성과학기술인 창업멘토링 사업 참여자 명단	사업 수혜자 관리	(필수) 이름, 생년월일, 핸드폰, 이메일, 성별, 소속, 최종학력, 전공	10년
여대학원생공학연구 팀제지원사업 참여자 명단	사업 신청자 및 수혜자 관리	(필수) 이름, 핸드폰, 이메일, 소속, 전공, 성별, 출생년도	10년
글로벌 학술활동 지원사업 수혜자 명단	글로벌 학술활동 수혜자 정보 관리	(필수) 이름, 생년월일, 핸드폰, 이메일, 학위정보, 참가 학회·연수 정보, 연구정보	10년
과학기술분야 R&D 대체인력활용 지원사업 신청자 명단(기관)	신청기관 관리, 지원요건 확인 등	(필수) [담당자] 이름, 직위, 연락처, 휴대폰, 이메일 [활용책임자] 이름, 소속부서, 직위, 전공, 성별, 생년, 연락처, 이메일	10년
과학기술분야 R&D 대체인력활용 지원사업 신청자 명단(인력)	신청인력 관리, 지원요건 확인 등	(필수) 이름, 생년월일, 핸드폰, 이메일, 최종전공, 최종학위, 업무경력, 경력단절사유, 혼인상태, 자녀유무, 경력단절기간, 고용보험가입유무, 이력정보, 자기소개서, 경력정보	10년
과학기술분야 R&D 대체인력활용 지원사업 수혜자 명단(인력, 기관담당자)	참여인력 및 참여기관 관리, 사업운영관리, 성과관리 등	(필수) [인력] 이름, 생년월일, 주소, 핸드폰, 이메일, 최종전공, 최종학위, 업무경력, 고용보험 가입여부, 이력정보, 자기소개서 [기관] [담당자] 이름, 직위, 연락처, 휴대폰, 이메일, 팩스번호 [활용책임자] 이름, 소속부서, 직급, 연락처, 이메일	10년
신진여성연구원 산업현장진출 지원사업 신청자 명단(기관)	신청기업 관리, 지원요건 확인 등	(필수) [담당자] 이름, 직위, 연락처, 휴대폰, 이메일	10년
신진여성연구원 산업현장진출 지원사업 신청자 명단(인력)	신청인력 관리, 지원요건 확인 등	(필수) 이름, 생년월일, 주소, 핸드폰, 이메일, 최종전공, 최종학위, 업무경력, 경력단절사유, 혼인상태, 자녀유무, 경력단절기간, 고용보험가입유무, 이력정보, 자기소개서, 경력정보	10년
신진여성연구원 산업현장진출 지원사업 수혜자 명단(인력, 기관담당자)	지원인력 및 지원기업 관리, 사업운영관리, 성과 관리 등	(필수) [개인] 이름, 생년월일, 핸드폰, 이메일, 학력, 전공, 학위취득일, 채용일자, 정규직여부, 연봉 [기관] 담당자 이름, 직위, 연락처, 휴대폰, 이메일	10년
여성과학기술인 R&D 경력복귀 지원사업 신청자 명단(기관)	신청기관 관리, 지원요건 확인 등	(필수) [담당자] 이름, 직위, 연락처, 휴대폰, 이메일 [활용책임자] 이름, 소속부서, 직위, 전공, 성별, 생년, 연락처, 이메일	10년
여성과학기술인 R&D 경력복귀 지원사업 신청자 명단(인력)	신청인력 관리, 지원요건 확인 등	(필수) 이름, 생년월일, 주소, 핸드폰, 이메일, 최종전공, 최종학위, 업무경력, 경력단절사유, 혼인상태, 자녀유무, 경력단절기간, 고용보험가입유무, 이력정보, 자기소개서, 경력정보	10년
여성과학기술인 R&D 경력복귀 지원사업 선정 명단(인력, 기관담당자)	참여인력 및 참여기관 관리, 사업운영관리, 성과관리 등	(필수) [인력] 이름, 생년월일, 핸드폰, 이메일, 직장주소, 경력단절사유, 혼인상태, 자녀유무, 경력단절기간, 이력정보 [기관] 담당자정보(이름, 직위, 연락처, 핸드폰, 이메일), 활용책임자 정보(이름, 부서, 직위, 전공, 성별)	10년

개인정보처리의 위탁 표 입니다.
수탁업체	위탁업무	제공하는 목록	위탁기간
에스제이테크놀러지(주)	시스템 개발 및 유지보수, 기술적 보호 조치	이용자 정보	위탁계약 종료시까지
㈜한비로	서버 유지보수 및 기술적 보호조치	이용자 정보	위탁계약 종료시까지
NICE평가정보	본인인증	이름, 연락처(휴대폰)	인증 후 즉시파기
교육 및 행사업체	교육 및 행사 운영	이름, 연락처(휴대폰), 이메일	교육 및 행사 종료시까지

개인정보의 처리 및 보유기간 표 입니다.
구분	운영 근거	처리 목적	보유기간
W브릿지 회원 정보	정보주체의 동의	홈페이지 회원제 서비스 운영	회원 탈퇴시 까지
W브릿지 서비스 및 사업 신청 정보	정보주체의 동의	홈페이지 회원제 서비스 운영	서비스종료 후 10년 보관

개인정보처리의 위탁 표 입니다.
수탁업체	위탁업무	제공하는 목록	위탁기간
(주)누림소프트	서비스 제공을 위한 시스템 개발 및 유지보수, 기술적 보호 조치, WISET 뉴스레터 제작 및 발송	통합회원정보	회원탈퇴시 혹은 위탁계약 종료시까지
(주)한비로	서버 유지보수 및 기술적 보호조치	통합회원정보	위탁계약 종료시까지
NICE평가정보	본인인증	이름, 연락처(휴대폰)	인증 후 즉시파기
(주)엠앤와이즈	문자 및 카카오 알림톡 발송	연락처(휴대폰)	발송 후 즉시파기
교육업체	교육 운영	이름, 연락처(휴대폰), 이메일	위탁계약 종료시까지