인공지능과 함께 만드는 AI 뉴스레터 2025년 4월 16일 수요일 |
|
|
이번 레터에는 이런 내용들이 담겨 있어요.
👉 AI 기초 개념들을 소개하는 Baseline에서는, RAG를 소개해드려요.
👉 AI를 가지고 노는 Playground에서는, 클로드에게 토이 챗봇을 만들어 보게 했어요.
👉 What's News?에서는 4월 3주차 최신 뉴스와 소식들을 큐레이팅했어요. |
|
|
#RAG
챗GPT에게 일을 시켜본 적 있으신가요? 생각보다 어려울 거예요. 아무리 AI가 지식이 많고 뛰어나다 하더라도, 여러분의 회사나 업무에 관한 전문적인 지식까지 모두 가지고 있지는 않기 때문입니다. 이러한 한계를 극복하기 위해 나온 기술! 오늘 레터에서는 가장 기본적인 RAG의 개념에 대해 소개해드리겠습니다.
라그? 레그? 그게 뭔가요?
RAG는 'Retrieval-Augmented Generation'의 약자로, 우리말로 하면 '검색 증강 생성'이라고 할 수 있습니다. 이름 그대로 세 가지 과정을 담고 있습니다:
- 증강(Augmented): AI가 원래 가지고 있지 않은 정보와 지식을 추가해줍니다.
- 검색(Retrieval): 필요할 때 AI가 이 추가된 지식을 찾아볼 수 있게 합니다.
- 생성(Generation): 이 정보를 바탕으로 AI가 더 정확하고 유용한 답변을 만들어냅니다.
참고로 RAG를 읽는 방식은 다양해요. 사람들마다 '라그', '레그' 모두 혼용해서 쓰고 있어요.
어떻게 작동하나요?
RAG의 작동 방식은 생각보다 단순해요:
- 데이터 준비 및 임베딩: 먼저 AI가 참고할 수 있는 데이터베이스를 만듭니다. 여기에 회사 정보, 업무 지식 등을 저장해요.(주로 벡터로 변환하여 데이터베이스에 저장합니다. 벡터로 변환하는 과정을 임베딩이라고 해요.)
- 검색: 사용자가 질문을 하면, 검색 시스템이 데이터베이스에서 관련 정보를 찾아옵니다. 이렇게 찾은 문서를 LLM에게 전달합니다.(사용자의 질문도 벡터로 변환이 되고, 검색 엔진은 질문 벡터와 가장 유사한 문서 벡터를 찾아냅니다. 벡터 검색 외에도 다른 검색 방법들도 많이 있습니다.)
- 생성: LLM는 사용자의 질문과, 검색된 문서를 함께 제공받습니다. 모델은 제공된 문서를 바탕으로 더 정확한 답변을 생성할 수 있습니다.
왜 RAG가 중요할까요?
- 실제 비즈니스에 적용하기 좋아요. LLM은 온라인에 공개된 정보를 기반으로 학습했기 때문에 현실에서 사용하는 기업 문서나 산업의 전문 지식을 가지고 있지 않습니다. 이런 전문적, 비공개 데이터를 활용할 수 있는 방법 중 하나가 RAG입니다.
- 정확도와 신뢰도가 올라가요. 외부의 정보 소스를 직접 참조하기 때문에 ‘환각’이 줄어듭니다. 특히나 금융, 의료, 법률 등과 같이 전문 지식이 방대한 영역에서는 RAG를 이용해 각 산업별로 특화된 AI를 만들 수 있습니다.
- 비용이 적게 들어요. 전문 분야 데이터를 쏟아 부어 LLM을 파인튜닝한다면 많은 비용과 시간이 들지만, RAG를 이용하면 작고 저렴한 모델로도 우수한 성능을 낼 수 있습니다.
- 유연성과 확장성이 좋습니다. 새로운 정보나 지식을 업데이트하기 편리합니다. 데이터베이스에 추가하기만 하면 되니깐요.
딥시크(DeepSeek)가 많은 사람들에게 충격을 준 이유가 뭘까요. 저렴한 오픈소스 모델을 사용하면서도, 기업이 보유한 데이터를 RAG로 활용하면 놀라운 효율성을 얻을 수 있기 때문입니다. RAG를 통해 여러분만의 데이터로 AI를 강화하면, 고가의 최신 모델을 사용하지 않더라도 그 분야에서는 최고의 전문가로 만들 수 있답니다. 이것이 RAG의 진정한 매력!
|
|
|
#쉘든 챗봇을 만들어 줘
바이브코딩만으로 아주아주 간단한 캐릭터 챗봇을 만들고, streamlit으로 대화해볼 수 있도록 만들어볼까요? 제가 좋아하던 미국 드라마 ‘빅뱅이론’에서 쉘든 캐릭터를 가지고 만들어보았습니다. 클로드에게 아래 프롬프트를 입력해 만들었습니다. (따라해보기 위해서는 기본적인 코딩 지식이 필요합니다. 참고 문서)
프롬프트
빅뱅이론의 쉘든의 페르소나를 가지고 있는 챗봇을 만들어줘. 아래 사항을 참조해서 만들어.
- 데스크탑에 'BigbangTheory'라는 폴더를 만들어서 여기서 작업해.
- (경로 주소)에 빅뱅이론 드라마 스크립트가 txt 파일로 저장되어 있어.
- 스크립트 데이터를 복사해서 페르소나를 만드는 데 데이터베이스로 사용해.
- RAG 방식을 쓸꺼고, OpenAI API 키를 입력해서 쓸 수 있도록 랭체인으로 구성해줘.
- 모델은 gpt-3.5-turbo-1106 를 쓸꺼야. 벡터스토어는 뭘 쓰던 상관없어.
- 쉘든의 페르소나와 대화를 할 때 메모리를 가지고 대화를 이어갈 수 있도록 만들어.
- 출력은 코드 파일로 주고, 터미널에서 곧바로 실행시키면 streamlit에서 챗봇을 사용할 수 있게 해줘.
|
|
|
클로드가 간단하게 만들어준 쉘든 챗봇은 어딘가 좀 아방하니 모자란 느낌입니다. 챗지피티 3.5 무료 모델의 한계에, 참조하는 문서의 양도 너무 많았습니다. 미니 모델을 사용하면 돈도 얼마 안든다고 하니, OpenAI 플랫폼에 돈을 10달러 정도 충전하고 써봐도 괜찮습니다. API 챗봇의 성능을 좀 더 높이고 싶다면, RAG를 각 구성요소들을 뜯어보고 프롬프트 또한 직접 변경해보면서 성능을 높여보세요! |
|
|
오픈AI의 활발한 행보
- GPT-4.1이 드디어 등장했어요! 개발자들에게 먼저 공개되었는데요, 코딩과 지시사항 준수 능력이 예전 모델보다 무려 27%나 향상되었다고 해요. (기사)
- 챗GPT에 '기억력'이 생겼어요. 이제 여러분이 일일이 알려주지 않아도 과거 대화 내용을 기억하고 맥락을 이해해요. 걱정 마세요, 설정에서 기억 내용을 확인하고 삭제할 수도 있답니다. (기사)
- 오픈AI가 SNS 시장에도 도전장을 내밀었어요! 챗GPT와 연동되는 소셜 플랫폼을 개발 중이라고. 머스크의 X, 저커버그의 인스타그램과 경쟁할 수 있어 업계에 파장이 예상됩니다. (기사)
구글과 삼성의 협력 강화
- 구글이 '제미나이'에 '비오2'를 통합했어요. 간단한 텍스트 명령으로 8초짜리 동영상을 순식간에 만들어낼 수 있다니, AI 영상 생성 시장이 더욱 뜨거워질 것 같아요. (기사)
- 삼성과 구글의 협력이 더욱 강화되고 있어요. 스마트폰을 넘어서 초경량 스마트안경, 가정용 로봇, XR 헤드셋까지 협업 범위를 확대한다고 해요. 삼성의 하드웨어 + 구글의 소프트웨어가 만나면 어떤 혁신이 일어날지 기대되네요! (기사)
AI 업계 소식들
- 제프 딘이 작고 빠른 추론 AI의 중요성을 강조했어요. AI 연산 수요가 증가하는 만큼 하드웨어 발전이 추론 효율성을 높여야 한다고 말했답니다. (기사)
- 미국이 엔비디아의 H20 칩 대중국 수출을 사실상 금지했어요. AI 관세 전쟁이 본격화되는 가운데, 엔비디아는 약 7조원 규모의 손실을 예상하고 있습니다. (기사)
- 업스테이지가 글로벌 시장 공략에 나섰어요. 한국을 넘어 미국과 아시아 시장을 목표로, 6월에는 LLM 솔라 프로 1.5와 멀티모달 모델 솔라 DocVLM을 출시합니다. (기사)
- AI 인재 부족 문제가 심각해요. 올해만 1만 명 이상의 AI 인재가 부족하다고 하네요. 고용부의 '초거대AI추진협의회 간담회'에서는 우수 인재 확보의 어려움이 논의되었습니다. (기사)
|
|
|
오늘 뉴스레터 어떠셨나요?
의견을 남기고 싶다면 eddie.workwithai@gmail.com로 메일을 보내주세요. |
|
|
|