생성형 AI
- 지난 2년간 IT 업계의 최대 화두는 누가 뭐라고 해도 생성행 AI 라고 생각합니다. Open AI에서 제공하는 Chat GPT를 시작으로 Google, Meta 같은 글로벌 기업들이 유사한 서비스를 시작했고 더 놀라웠던건 3개월 혹은 6개월 단위로 이전에는 해결하지 못할거라고 생각한 문제들을 풀면서 업그레이드 되었다는 것이었습니다.
- 그런데 생성형 AI를 실전에 적용해 보셨나요? 아마 처음 서비스에서 받은 놀라움에 비해서 실제 서비스에 이를 적용하는 과정에서는 실망이 많으셨을 겁니다. 여전히 매우 빠른 속도로 모두의 예상을 뛰어넘는 발전을 이루고 있기 때문에 실망이라는 표현을 하기가 두려운 점은 있으나 현재 시점으로 보자면 실망이 맞을 겁니다.
- 왜 그럴까요? 근본 원인은 지금 우리가 생성형 AI라고 부르는 모델의 원래 이름 LLM(Large Language Model)으로 부터 봐야 합니다. (이걸 길게 설명하는 것은 적절치 않아서 나름 잘 설명한 다른 회사 블로그를 Link 합니다.)
03-01 언어 모델(Language Model)이란? – 딥 러닝을 이용한 자연어 처리 입문
- 그런데 우리가 꼭 저런걸 다 알아야 하는가라는 질문에 빠지죠. 저 같이 모델을 서비스화 하겠다고 하는 사람의 입장에서도 매우 어렵고 이런 저런 발전이 더해 지면서 혼란은 더 커집니다.
- 대략의 일반인 (약간의 전문가도 포함해서) 이 이해하는 정도로 설명을 하자면 언어모델은 확률적으로 앞의 단어 다음에 나올 단어 또는 문장을 제시해주는 모델이라고 이해하면 될 것 같습니다. LLM 모델은 이전 언어 모델이 해결하지 못한 많은 문제를 해결한건 맞지만 언어 모델의 한계를 넘어서지는 못하고 있고 앞으로도 아마도 그 한계는 넘지 못할것 같습니다. (마이클 잭슨이 백인이 되고 싶어서 어마어마한 돈으로 성형을 해서 백인같아 보이기는 했으나 그가 가진 흑인의 특성은 없어지지 않았다고 생각합니다. 불가능 하다는 뜻은 아닙니다. 현재는 그렇다고 생각한다는 뜻입니다.)
- 저희 회사도 많은 시도를 통해서 LLM을 적용하려고 하고 있으나 현재까지는 가능한 부분과 불가능한 부분이 구분된다고 생각합니다. (한계가 있다는 점을 알면서도 회사의 꽤 많은 인원들이 새로나오는 모델이나 서비스를 테스트하고 실전에 적용하는 노력을 하고 있습니다. 발전 속도가 너무 놀라워서 예상하지 못한 결과들이 있을 수 있다고 생각하고 있습니다. )
현업에 적용 가능한 생성형 AI
- 현 시점에서 많은 사업자들이 생성형 AI를 활용해서 서비스를 제공하고 있습니다. LLM이 가진 한계를 극복하기 위한 노력도 많이 시도되고 있습니다. (최근에는 Multi Agent와 Multi Agent를 Control 하는 Coordinator,SQL Agent, 검증 Agent 같은 다양한 형태의 시도가 있는 것으로 알고 있습니다.)
- 많은 사람들이 가장 우려하고 문제가 된다고 생각하는 Hallucination에 대해서는 저는 긍정적인 편 입니다. 현업에서 사용하는데 방해가 될 수 있지만 결국 새로운 뭔가를 만드는데 가장 중요한 역할을 하지 않을까 생각합니다. 마치 핸드폰이 실제 나오기 수 십년전에 영화에는 나왔고 많은 신화에서 나오는 원격대화 같은 상상이 결국 핸드폰을 우리 손에 쥐어준 것 이라고 생각합니다. 망상과 착각이 상상하고는 어떻게 다른 걸까? 궁극적으로는 비슷한거 아닐까? 이 이정도 생각입니다.
- 그럼에도 불구하고 현 시점에서 사용 가능한 주요 기능을 나열하고 점수를 주었습니다. (점수는 제가 임의로 정한 것이고 상대적인 비교라고 생각해 주시면 좋을 것 같습니다. )
- 대화 80점 (대화는 원활하게 되지만 나의 대화 의도는 잘 모른다. )
- 요약 90점 (문서 또는 음성 대화를 요약하는 능력은 뛰어나다.)
- 번역 95점 (번역되는 언어의 감성까지 살려서 거의 완벽하게 번역한다.)
- 분류 70점 ( 분류 기준이 명확하면 잘 작동되지만 모호한 부분에서는 실패 확률이 높다.)
- 추천 70점 (특정 목적에 근거한 추천은 목적을 이해하기 어렵다.)
- 연산 30점 (그래서 최근에 연산만 하는 별도 모듈을 만들어서 성능을 높이고 있는 것 같습니다. )
- 어센트 코리아는 검색 Data를 서비스하는 회사이고 한국 뿐만 아니라 글로벌을 지향하기 때문에 자체적으로 개발한 여러가지 형태의 언어를 다루는 알고리즘을 가지고 있습니다. 그럼에도 불구하고 일부 기능은 LLM을 활용하는 것이 효과적이고 효율적이라고 판단하고 있고 그래서 이를 서비스에 제공하도록 하고 있습니다.
- 저희가 제공하는 리스닝 마인드에서는 상대적으로 신뢰할 수 있는 결과를 제공하는 요약, 분류, 추천의 3가지를 활용합니다. 그리고 저희는 검색 결과와 그 결과의 관계 Data를 가지고 있기 때문에 RAG (Retrieval-Augmented Generation)의 구조를 활용하고 있습니다. RAG를 활용하는 이유는 같은 질문을 하더라도 사용자가 원하는 맥락에 보다 근접한 문장을 확보할 수 있기 때문입니다.
SERP 요약 및 분석
- 리스닝 마인드는 키워드로 구성되어 있고 이 키워드의 의미는 한가지가 아닐 수 있습니다. 그리고 시시각각 변화합니다. 같은 축구협회를 입력했을 때 시점에 따라 검색 결과는 다를 수 있습니다. 그 결과가 다른 이유는 인텐트가 변화되기 때문입니다. 인텐트의 가장 기초가 되는 Data 라고 생각합니다. 그래서 키워드를 제공하는 모든 서비스에서 “구글 스냅샷 확인”이라는 기능을 클릭하면 저희가 제공하고 있는 data의 기준이 되는 Serp(검색 결과 페이지)를 볼 수 있습니다. 그리고 분석을 클릭하면 검색 인텐트를 요약해 제공하고 있습니다.
Intent Finder에 적용
- Intent Finder는 입력한 키워드를 포함한 검색어들을 찾아주고 그 검색량, 검색인텐트 등을 제공하는 서비스 입니다.
- 이 서비스에서는 키워드 추천에 생성형 AI를 활용하고 있습니다. 검색에서 제일 어려운 작업은 키워드를 입력하는 것입니다. 우리 회사, 우리 제품 이후에 뭘 넣어야 할까? 어떤 키워드로 조회해야 내가 원하는 것을 찾을 수 있을까?
- 키워드를 클릭하면 키워드를 수정하거나 추천을 받을 수 있습니다. 인텐트 파인더에는 글자를 입력하는 중간에도 키워드가 추천되는데 이 경우는 입력 진행 중인 글자를 포함하고 있는 단어 중에 검색량이 높은 키워드를 추천하는 방법이고 입력한 이후에 추천은 20개의 키워드를 추천해 주는데 이것은 목표하는 단어를 입력한 이후에 목표 키워드를 제외하고 제외하고 리스닝 마인드가 보유한 키워 중에서 유사도가 높은 10개 키워드와 (앞쪽) GPT가 추천하는 10개 (뒤쪽)으로 추천됩니다.
- 키워드에 대한 전문 지식이 없을 경우에 유용합니다. 리스닝 마인드가 보유한 키워드의 유사도 기준으로 추천된 키워드는 그럴 듯한 키워드가 많은 반면 GPT가 추천한 키워드는 갸우뚱 하다가 아! 그래서…. 이런 경우가 많습니다.
상위 컨텐츠 적용
- 상위 컨텐츠는 특정 검색어를 검색했을 때 구글이 제공하는 상위 10개의 검색 결과를 URL 별로 요약하고 이 검색 결과로 보건데 문서를 만든다면 어떤 문서를 만들면 좋을지를 추천해 주는 서비스 입니다.
- 이 서비스에서 GPT의 역할은 요약과 추천 입니다. GPT가 가장 잘하는 요약이기 때문에 문서의 요약은 90점 이상입니다. 이에 반해서 아이디어 추천은 70점 정도를 기대하시는 것이 좋습니다. 문장으로 제공할 경우 현업 사용에 효과적이지 않다고 판단해서 타이틀/디스크립션/구성 아이디어로 제공하고 있습니다.
- 저도 서비스를 소개하는 컨텐츠를 쓰고 있지만 생각보다 쉽지 않은 일 입니다. 게다가 어떤 주제로 설명을 해야할지 잘 모를 때, 새로운 사업 영역으로 진입할 때, 경쟁사와 컨텐츠 선점을 위해 작업을 진행할 때 꼭 필요한 기능이라고 생각합니다.
패스 파인더에 적용
- 패스 파인더에는 Path 뷰에서” 키워드 분류”와 페르소나 뷰에서 “클러스터명 생성”과 “GPT 리뷰”에서 사용되고 있습니다. 페르소나 뷰에서 적용되는 내용은 클러스터 파인더에서 적용되는 내용과 동일하기 때문에 아래 클러스터 파인더 적용의 설명을 참조하시는게 좋을 것 같습니다.
- 패스 파인더 Path 뷰에서 키워드 분류는 우리가 목적하고 있는 키워드의 이전 키워드와 이후 키워드를 유사도가 높은 키워드들로 군집화 하고 이 군집을 대표하는 이름을 붙여 주는 작업입니다.
리스닝마인드 가이드 l 패스파인더 l 검색 화면 이해하기
- 패스 파인더는 우리가 목표로 하는 키워드를 포함하는 경로를 연결해서 시각화한 결과 입니다. 모든 경로가 각각의 다른 의도로 구성되어 있을 수도 있지만 일반적으로는 비슷한 몇개의 경로의 변형이라고 볼 수 있습니다. 그래서 목표 검색어 앞/뒤의 키워드를 군집화하고 이름을 붙이고 있습니다. GPT를 사용해서 진행하는 분류라서 70점 정도의 결과를 기대하시라고 권고합니다. 하지만 가끔은 100점으로 나오는 경우도 있습니다. 분류가 70점이기 때문에 군집의 이름도 70점 정도를 기대할 수 있습니다.
클러스터 파인더에 적용
- 클러스터 파인더의 군집화는 어센트 코리아에서 구축한 알고리즘으로 시각화를 진행한 결과 입니다. 그런데 이 군집의 이름을 붙이는 작업은 RAG 형태로 GPT를 활용하고 있습니다. 좌측에 군집의 이름을 볼 수 있는데 이 부분이 GPT를 활용한 결과 입니다. RAG를 활용하면 80점 정도의 결과를 만들 수 있다고 생각합니다.
리스닝마인드 가이드 l 클러스터파인더 l 검색 화면 이해하기
- 그 다음이 “GPT 리뷰”라는 기능 입니다. 글 처음에도 이야기 했던 것처럼 GPT는 요약은 매우 뛰어 납니다. 리스닝 마인드는 키워드간의 관계와 키워드를 최대한 활용할 수 있는 프롬프트를 만들어서 전체 키워드와 클러스터의 상황, 검색 인텐트의 분포 그리고 이 키워드를 검색하는 사람의 관심사를 설명하고 있습니다. 이 부분은 RAG의 형태를 활용하고 있어서 80점은 넘고 90점은 안되는 수준으로 보입니다. 90점 이상의 결과를 만들지는 못하지만 예시로 보여드리는 “무신사”의 검색 결과는 15,000개 정도 되는데 이 많은 키워드를 전부 눈으로 보는 것 보다는 훨씬 효율적이고 효과적이라고 생각합니다.
- 같은 “GPT 리뷰” 이지만 클러스터를 선택하고 사용하는 경우에는 다른 결과를 제공하고 있습니다. 저희 생각에는 클러스터 파인더의 특정 클러스터는 인텐트가 좀 더 명확해 진 상황이고 (인텐트를 안다는 건 특정 키워드를 검색한 동기와 목적을 알 수 있다고 생각 합니다. ) 인텐트가 명확하면 이에 대한 적절한 대응이 가능하능 하다고 생각합니다. 그래서 클러스터의 키워드를 분석하고(종합분석), 어떤 페르소나를 가진 사람이 특정 문제를 해결하고 싶은지,궁금한 것이 무엇인지를 분석하고(페르소나) 이에 대한 대응으로 마케팅 활동을 할 수 있는지 (인사이트)를 제공하고 있습니다. 이 기능도 RAG를 구조를 활용하고 있습니다. 위의 전체 클러스터 설명보다는 정확도가 높다고 생각합니다. 이유는 GPT에 제공하는 키워드들의 유사도가 높아서 딴 방향으로 흘러갈 가능성이 높지 않기 때문입니다.
- 클러스터 파인더에서 사용한 GPT 활용 내용은 패스파인더의 페스소나 뷰에서도 동일하게 적용되어 제공되고 있습니다.
결론
- 저희 어센트 코리아는 검색 Data를 수집하고 분석하는 업무를 주업무로 하기 때문에 기술에 민감하게 반응해야 합니다. 그래서 GPT에도 관심이 많았고 여러 요소에서 사용하려고 노력하고 있습니다.
- 앞으로 계속 발전이 있을 것으로 기대하고 예상하고 있지만 현재 수준에서는 요약과 추천이 효과적으로 사용 가능한 것으로 생각하고 있습니다. (사용 가능한 수준이 아니라 사실은 꼭 사용해야 한다고 생각합니다. 키워드 하나에 만개가 넘는 클러스터 파인더에서 의미를 찾으려면 사실은 모든 키워드와 검색결과를 검토해야 하는데 GPT가 충분히 잘 요약해서 보여주고 있습니다. 그 요약 내용도 보기 어려우시다면 죄송할 뿐입니다. )
- 그럼에도 불구하고 저희는 계속 새로운 기술의 적용에 대해서 실험하고 검토할 생각입니다. 새로운 기술의 이해와 적용에 목적이 있다기 보다는 검색 Data를 통해서 고객의 마음을 이해하고 Intent를 이해하는데 리스닝 마인드가 기여하고 싶기 때문입니다.