인공지능과 함께 만드는 AI 뉴스레터 2025년 5월 14일 수요일 |
|
|
이번 레터에는 이런 내용들이 담겨 있어요.
👉 AI 기초 개념들을 소개하는 Baseline에서는, Top-K와 Top-P에 대해 알아봤어요.
👉 AI를 가지고 노는 Playground에서는, 온도와 Top-P를 조절한 프롬프트를 비교했어요.
👉 What's News?에서는 최신 뉴스들을 큐레이팅했어요. |
|
|
지난 레터에서 AI 모델이 생성할 다음 단어의 무작위성을 조절하는 ‘온도(temperature)’ 샘플링에 대해 알아보았는데요. 이번 레터에서는 온도와 함께 사용할 수 있는 Top-k, Top-p 샘플링의 개념에 대해 정리해 보았습니다.
#Top-K와 Top-P 샘플링
Top-k
모델이 예측한 확률 분포에서 가장 높은 확률을 가진 상위 k개의 토큰을 선택합니다. 후보로 뽑힌 k개 토큰 중에서 다음 토큰이 결정되며, 확률이 낮은 토큰들은 후보에서 제외됩니다.
Top-P(nucleus sampling)
누적 확률이 특정 임계값(P)을 넘지 않는 가장 확률이 높은 토큰들의 집합을 선택합니다. 다음에 올 단어를 하나씩 더해가면서 누적 확률값을 계산하고, 임계값을 넘지 않을 때까지의 단어들만 다음 단어 목록에 추가합니다.
예를 들어 LLM이 “오늘 날씨는” 뒤에 나올 단어를 고르고 있다고 해보겠습니다. 뒤에 올 단어로 좋다(45%), 매우(25%), 싫다(20%), 왜(8%), ?(2%)가 있습니다. Top K는 상위 K개의 토큰만 후보로 포함시킵니다. K를 3으로 지정하면 단어 3개를 위에서부터 차례대로 고르는 것이죠. Top P는 누적 확률 P에 도달할 때까지 토큰을 후보로 등록합니다. P를 0.85라고 한다면 좋다(0.45), 매우(0.25), 싫다(0.2)를 더하면 누적이 0.9가 되니, 싫다를 뺀 좋다와 매우 만이 후보가 됩니다. |
|
|
Top K는 항상 정확히 K개의 단어를 고르는 방식이라 정적인 것에 비해, Top P는 확률 분포에 따라 고려하는 단어 숫자가 변하는 동적인 방식입니다. 그래서 Top K보다 Top P를 조절했을 때 문맥에 따른 옵션의 수가 변하여 선택지를 조정할 수 있습니다.
만약 굉장히 높은 확률을 갖는 확실한 답이 있는 경우에 Top P를 설정하면, 확실한 답 하나만이 선택될 수 있습니다. “대한민국의 수도는” 뒤에 올 단어를 생성한다고 할 때 “서울”이 높은 확률을 가지면, top p의 임계값이 금방 차서 다른 단어가 후보에 들어가지 못합니다. 하지만 Top K를 3으로 고정한다면 확률 낮은 “부산”, “인천”과 같은 토큰까지도 불필요하게 포함될 수 있습니다.
반대로 다음 단어로 다양한 단어들이 올 수 있는 고른 확률 분포를 가질 때에는 누적 확률에 도달할 때까지 여러 단어들이 후보에 포함될 수 있습니다. “오늘 저녁은” 다음에 올 단어로 “치킨(10%)”, “피자(12%)”, “김치찌개(8%)” 등등으로 비슷한 확률로 분포하는 경우에는 top p의 임계값에 도달할 때까지 10개 이상의 여러 단어들 포함될 것입니다. 하지만 top k를 5로 고정하면 상위 5개 단어만 포함되어 다양한 선택지가 제한됩니다.
정리하면 Top-K와 Top-P는 다음 토큰 예측을 상위 확률을 가진 토큰으로 제한하는 샘플링 설정입니다. top-k나 top-p로 후보 토큰들이 선발되면 온도 설정이 적용되어 최종적으로 다음 토큰을 결정합니다.
구글에서 발간한 프롬프트 엔지니어링 백서에 따르면, 온도가 높을수록, Top-K 또는 Top-P 값이 높을수록 LLM은 더 많은 자유도를 가지게 됩니다. Top-K 값을 높게 설정하면, 모델이 더 많은 후보를 뽑게 되니 출력의 다양성과 창의성이 늘어나고 반대로 낮게 설정하면, 선택의 폭이 좁아져 더 제한적이고 사실적인 경향을 보입니다. Top-P 값은 너무 낮게 설정하면 다양성이 제한되고, 너무 높게 설정하면 이상한 단어들이 포함될 수 있어 적절한 값을 찾는 것이 중요합니다. 실제로는 두 가지를 동시에 조절하는 경우, Top-P로 먼저 필터링을 한 뒤 Top-K를 적용하는 방식이 자주 사용됩니다. |
|
|
# 온도와 Top P를 조절하면 답변이 이렇게 달라져요
오픈AI 플레이그라운드에서는 Top K의 값은 고정이 되어 있고, 온도와 Top P의 값만 조절해서 사용해 볼 수 있습니다. 그렇다면 실제 이 값을 바꿨을 때 답변이 어떻게 달라지는지 살펴보겠습니다.
먼저 온도는 동일하게 1로 두고, Top P의 값만 바꿔서 비교해 보았습니다. 요거트 아이스크림과 잘 어울리는 음식을 추천해달라고 했는데, Top P를 0.1로 뒀을 때는 누가 봐도 정답인(?) 잘 어울리는 음식들을 추천하고 있습니다. 반면 Top P 값을 0.85로 줬을 때에는 “블루베리 케이크”나 “민트초코 쿠키”, 심지어 “샌드위치”와 같은 음식을 추천하네요.
|
|
|
이처럼 Top P의 값을 낮게 주면, 안정적이고 제한된 예측 가능한 답변을 생성하게 됩니다. (답이 있는 질문에 대해서).
창의적인 답변이 필요한 질문으로 “안드로메다 은하에서 지구로 여행을 온 외계인이 사람을 납치한 뒤에 하는 말은?”을 물었습니다. 온도 0.1, Top p 0.1로 정석적인 답변을 유도했을 때는 정중하고 예의 바른 외계인의 답변을 내놓았는데요. 반대로 온도 0.9, top p 0.9로 높였을 때 답변이 꽤 인상적입니다. |
|
|
말도 안 되는 질문을 또 해봤습니다. “마법사가 죽음의 마법을 외칠 때 쓰는 주문”은 뭘까요? 온도와 top p를 높였을 때는 정말 아무 말이나 하는 것 같네요. |
|
|
번역 작업을 할 때는 어떨까요? 오징어 게임의 명대사를 영어로 한번 번역해보도록 했습니다. 번역은 딱딱하지 않으면서 동시에 자연스러운 표현이 중요하기 때문에 온도와 top p값을 여러 번 바꿔가며 테스트를 해야합니다. 온도와 top p를 모두 0.1로 뒀을 때보다 온도와 top p를 높였을 때 좀 더 풍부한 번역이 나오는 것을 볼 수 있습니다. |
|
|
어떤 글을 번역하느냐에 따라서도 적절한 온도와 top p 값이 달라지겠죠? 정답은 없습니다. 여러분도 값을 조정하면서 조금씩 차이를 느껴보시길 바래요! |
|
|
요즘엔 무슨 일이?
기업
- 美 엔비디아, 사우디에 최신 AI 칩 1만8천개 공급…주가 5%↑(링크)
- 이재용의 2.4조 '빅딜'‥삼성·LG AI데이터센터 '냉각 전쟁' 본격화(링크)
- 생성형 AI가 바꾼 인재시장 판도…국내 기업 63%, 전담 AI CAIO 임명(링크)
- SK㈜ C&C, 'SK AX'로 새출발…AI 중심 글로벌 혁신 본격화(링크)
- 구글, AI 스타트업 펀드 출시..."최신 모델·도구 액세스 제공"(링크)
- 업스테이지, 한글 AI 교열 서비스 '에디트업' 출시(링크)
- 알리바바, AI 검색 능력 향상하는 '제로서치' 훈련법 공개…"검색엔진 필요 없어 비용 88% 절감"(링크)
- 54%가 AI 최우선… 한국 기업, 데이터·엔지니어링 소규모팀 속속 만든다(링크)
정부
- 美, 화웨이 AI 칩 규제 강화…"어디서든 쓰면 수출 통제 위반"(링크)
- 'AI 확산 범정부 협의체' 구성…"공공분야 AI 본격 도입"(링크)
- 사우디 왕세자, 트럼프 방문 앞두고 AI 회사 설립(링크)
- 관광공사, 생성형 AI 활용 '2025 관광 프롬프톤' 개최(링크)
- 게임도 예외 아닌 AI기본법…입법조사처 "AI 사용여부 표시해야"(링크)
학계
- "추론 모델 성장도 1년 뒤 한계 부딪힐 수 있어...컴퓨팅 3~5개월마다 10배 증가"(링크)
- 외부 데이터 없이 스스로 배우고 성장하는 '자기주도형' 추론 모델 등장(링크)
- "AI의 과학논문 요약 믿을 수 없어…과도한 일반화 편향 많아"(링크)
|
|
|
오늘 뉴스레터 어떠셨나요?
의견을 남기고 싶다면 eddie.workwithai@gmail.com로 메일을 보내주세요. |
|
|
|