작업 기억

학습 목표

예상 소요 시간: 30분

이 레슨을 마치면 다음을 수행할 수 있습니다:

  • 고정 크기 컨테이너로서의 컨텍스트 창을 설명하고, 긴 문서, 긴 대화, 세션 간 기억에 대한 시사점을 이해합니다
  • 다른 속성들의 점진적 저하와 달리 이 속성이 갖는 “절벽” 특성을 인식합니다
  • 컨텍스트를 레버리지로 활용하는 전략을 적용합니다: 중요한 내용 앞에 배치하기, 긴 작업 분할하기, 핵심 컨텍스트 재공급하기
  • 기억, 압축, 프로젝트/워크스페이스, 더 큰 창을 이 한계를 해결하는 제품 기능으로 인식합니다

컨텍스트 창: AI의 작업 기억

읽기 전에

다음 작업이 “50페이지 계약서 검토” 가 작업 기억 연속선에서 어디에 위치할까요? 아래 마커를 드래그하여 예측해 보세요.

작업 기억

AI가 지금 주목하고 있는 것은 무엇인가요?

역량 한계
내 작업
내용이 충분히 들어가고, 현재 세션이며, 관련 컨텍스트를 제공하는 경우 매우 긴 문서/대화, 세션 간 연속성 기대 (절벽 구간)
가능해지는 것
  • 빠른 세션 내 적응 (스타일 가이드, 샘플이 즉시 적용됨)
  • 다루는 대상: 나만의 자료: 내 문서, 내 제약 조건
  • 구체성을 통한 정밀도. 컨텍스트는 레버리지입니다.
특징적으로 실패하는 경우
  • 엄격한 길이 제한 : 초과 시 무음 잘림 발생
  • 중간에서 길을 잃음 : 창 전체에 걸쳐 주의가 균등하지 않음
  • 기본적으로 지속적 기억 없음 : 각 세션은 제로에서 시작
  • 사용자로부터 학습하지 않음 : 수정 사항은 모델이 아닌 컨텍스트만 변경
한계를 확장하는 제품 기능
  • 메모리 : 세션 간 사실 정보를 유지
  • 압축 / 요약 : 오래된 대화를 압축하여 공간 확보
  • 프로젝트 / 워크스페이스 : 상시 문서를 컨텍스트에 안정적으로 유지
  • 스킬 : 필요할 때까지 컨텍스트 사용 최소화
  • 더 큰 컨텍스트 창 : 절벽을 더 멀리 밀어냄

마커를 드래그하여 “50페이지 계약서 검토” 에 대한 예측을 배치하세요. 강조되는 패널이 주의해야 할 사항을 알려줍니다.

AI가 주의를 기울이는 모든 것은 하나의 고정 크기 작업 공간, 즉 컨텍스트 창 안에 존재합니다. 지시 사항, 업로드된 문서, 이전 응답, 주고받은 대화 등 모든 것이 하나의 유한한 컨테이너 안에 담겨 있으며, 모델은 응답을 생성할 때마다 처음부터 끝까지 이를 읽습니다. 대화나 문서 집합이 창이 담을 수 있는 양을 초과하면 무언가가 빠져나갑니다. 보통은 가장 오래된 내용이, 대부분 조용히 사라집니다. 모델은 처음 세 개의 메시지를 삭제했다고 알리지 않고, 남은 내용으로 계속 진행합니다. 기본적으로 창은 세션 사이에도 비워집니다. 채팅을 닫고 내일 새로 열면, 제품 기능이 의도적으로 무언가를 이어주지 않는 한 처음부터 시작하게 됩니다. 다른 세 가지 속성과 달리, 이 속성은 완만한 기울기가 아닌 절벽처럼 작동합니다. 다음 토큰 예측은 점진적으로 저하되고, 지식도 점진적으로 얇아지지만, 작업 기억은 작동하다가 갑자기 작동하지 않는 경향이 있으며, 항상 경고가 주어지지는 않습니다.

역량 구간 안에 있는 동안, 컨텍스트는 실질적인 레버리지입니다. 스타일 가이드를 업로드하면 모델은 재학습 없이 즉시 적응합니다. 하지만 창 전체에 걸쳐 주의가 균등하지는 않습니다. 연구에 따르면 긴 입력의 중간에 묻힌 내용은 시작이나 끝 부분의 내용보다 가중치가 낮다는 "중간에서 길을 잃음" 효과가 있습니다. 제품들은 이러한 한계를 완화하기 위해 원시 창 위에 기능을 겹겹이 쌓습니다:

  • 메모리 매 세션마다 처음부터 시작하지 않도록 선택된 사실들을 세션 간에 저장합니다.
  • 압축 대화가 길어질 때 대화 기록을 압축하여 공간을 확보합니다.
  • 프로젝트 및 워크스페이스 재업로드 없이 상시 문서를 컨텍스트에 안정적으로 유지합니다.
  • 더 큰 컨텍스트 창 절벽을 더 멀리 밀어냅니다.

본인만의 기술도 중요합니다. 긴 문서에서는 중요한 내용을 앞에 배치하고, 큰 작업은 한꺼번에 업로드하는 대신 단계별로 나누고, 긴 대화에서 품질이 저하되면 지금까지의 내용을 간단히 요약하여 새로 시작하세요. 그 저하는 역량의 한계가 아니라 컨텍스트 한계인 경우가 많습니다.

핵심 요약

  • 작업 기억 는 AI 모델이 주의를 기울일 수 있는 고정된 컨텍스트 창을 가진다는 사실입니다.
    • 역량 구간: 내용이 충분히 들어가고, 현재 세션이며, 관련 컨텍스트를 제공하는 경우입니다.
    • 한계 구간: 매우 긴 문서나 대화, 세션 간 연속성 기대, 긴 입력의 중간에 중요한 정보를 묻어두는 경우입니다.
    • 이 속성은 절벽 특성을 가집니다 완만한 기울기가 아닙니다. 무음 잘림이 실패 방식이며, 항상 경고가 주어지지는 않습니다.
    • 모델은 수정 사항으로부터 학습하지 않습니다. 현재 컨텍스트에 있는 것에만 반응합니다.
    • 메모리 기능, 압축, 프로젝트, 더 큰 창, 멀티 에이전트 워크플로우 모두 이 절벽을 더 멀리 밀어내기 위해 존재합니다.
  • 4D 연결: 작업 기억은 설명(Description)이 작용하는 대상입니다. 창이 어떻게 작동하는지 알면 컨텍스트를 어떻게 구성하고, 언제 앞에 배치하며, 언제 새로 시작해야 하는지 알 수 있습니다.

연습

연습: 전후 비교

왜 하는가? 컨텍스트는 레버리지입니다. 동일한 작업이라도 적절한 컨텍스트를 제공하면 평범한 초안에서 진정으로 유용한 결과물로 바뀔 수 있습니다. 이 연습은 그것을 구체적으로 보여줍니다.

Lesson 1 목록에서 본인만이 가진 컨텍스트(스타일 가이드, 과거의 좋은 작업 예시, 역할이나 청중에 특화된 제약 조건)로 혜택을 받는 작업을 선택하세요. 이 작업의 결과물에서 "좋다"는 것이 어떤 모습인지 두세 줄로 작성하세요. 낯선 사람도 평가할 수 있을 만큼 명확하게 설명해야 합니다.

이제 세 가지 탐색을 실행하세요:

  1. 탐색 1: 콜드 스타트 대 컨텍스트. 컨텍스트 없이 작업을 요청하세요. 단순히 요청만 합니다. 출력을 저장하세요. 그런 다음 새 대화를 시작하고, 이번에는 스타일 가이드, 과거 예시 또는 제약 조건을 먼저 제공하여 동일한 작업을 실행하세요. 두 출력을 "좋다"의 정의와 비교하세요. 차이를 측정하세요.
  2. 탐색 2: 중간에서 길을 잃음. 더 긴 문서를 가져오거나(또는 참고 자료 몇 단락을 붙여 넣으세요). 그 중간에 구체적이고 중요한 지시 사항 하나를 묻어두세요. 그 묻힌 지시 사항에 정답이 달린 질문을 하세요. AI가 알아챘나요? 이제 그 지시 사항을 맨 위로 옮기고 다시 질문하세요. 비교해 보세요.
  3. 탐색 3: 백지 상태. 작업 컨텍스트에 대해 AI에게 무언가 구체적인 것을 가르치거나, 잘못된 것을 수정하는 짧은 대화를 나누세요. 그런 다음 새 대화를 열고, AI가 가르친 것을 기억한다고 가정하는 질문을 하세요. AI가 처음부터 시작하는 것을 지켜보세요.

작업 목록으로 돌아가 세 번째 주석을 추가하세요: 실행할 가치가 있으려면 상시 컨텍스트(프로젝트, 저장된 지시 사항, 업로드된 참고 문서)가 필요한 작업은 무엇이고, 컨텍스트 없이도 잘 작동하는 작업은 무엇인가요?

심화 목표: 사용하는 도구에 메모리 또는 프로젝트 기능이 있다면, 탐색 1의 컨텍스트로 하나를 설정하세요. 작업을 다시 실행하세요. 콜드 스타트 버전과 노력 및 품질을 비교하세요.

레슨 성찰

  • 컨텍스트를 앞에 배치하는 것이 출력 품질을 얼마나 변화시켰나요? 차이가 예상보다 컸나요?
  • 이번 주에 반복 설명을 멈추기 위해 설정할 상시 컨텍스트는 무엇인가요?

다음 내용

마지막 속성: 조종 가능성(Steerability). 지시를 내릴 때 실제로 얼마나 통제할 수 있으며, 그 통제는 어디서 무너질까요?

피드백

강좌를 진행하면서 강좌의 개념을 업무에 어떻게 활용하고 계신지, 그리고 어떠한 피드백이 있으신지 들려주세요. 피드백을 여기에서 공유해 주세요 .

감사의 말과 라이선스

Copyright 2026 Anthropic. Prof. Rick Dakan(링글링 예술 디자인 대학)과 Prof. Joseph Feller(코크 대학교)가 개발한 AI Fluency Framework를 기반으로 한 원작. CC BY-NC-SA 4.0 라이선스에 따라 공개.