조종 가능성

학습 목표

예상 소요 시간: 30분

이 수업을 마치면 다음을 할 수 있습니다:

  • 조종 가능성이 작동하는 이유(파인튜닝을 통해 모델이 지시 따르기를 학습)와 한계가 있는 이유(지시는 이해가 아닌 패턴 매칭을 통해 따름)를 설명할 수 있습니다.
  • 제어가 가장 강한 경우(짧고 구체적이며 검증 가능한 지시)와 가장 약한 경우(긴 추론 체인, 추상적 요청, 기본 정밀도 작업)를 예측할 수 있습니다.
  • 추론 편향, 문자적 해석, 불안정한 산술을 조종 가능성의 특징적 실패 사례로 식별할 수 있습니다.
  • 시스템 프롬프트, 코드 실행, 가시적 추론, 구조화된 출력을 이 한계를 다루는 제품 기능으로 인식할 수 있습니다.

실제로 얼마나 통제하고 있나요?

읽기 전에

"정확히 100단어, 그 이상은 안 됨" 이 조종 가능성 스펙트럼의 어디에 위치한다고 생각하나요? 아래 마커를 드래그한 후 예측을 확정하세요.

조종 가능성

나는 얼마나 통제하고 있나요?

역량 한계
내 작업
짧고 구체적이며 검증 가능한 지시 (“표로 응답”, “100단어 이내”) 긴 추론 체인, 추상적 요청, 기본 정밀도 작업
가능하게 하는 것
  • 형식, 스타일, 길이, 어조에 대한 정밀한 제어
  • 역할 설정: 페르소나나 전문가 프레임을 채택하고 유지
  • 명확한 프로세스를 따르는 다단계 작업 실행
  • 반복적 수정 (“더 짧게”, “여기를 더 구체적으로”)
특징적으로 실패하는 경우
  • 추론 편향 : 긴 체인에서 작은 오류가 누적됨
  • 문자적 해석 : 지시는 문자 그대로 충족되지만 의도는 놓침
  • 프롬프트 인젝션 : 문서에 포함된 원치 않거나 안전하지 않은 지시도 따를 수 있음
한계를 확장하는 제품 기능
  • 시스템 프롬프트 / 사용자 지정 지시 : 희석되지 않는 고정 지시
  • 코드 실행 : 수학 계산을 실제 인터프리터에 위임
  • 가시적 추론 : 최종 답변이 아닌 2단계에서 편향 포착
  • 구조화된 출력 모드 : 문자적 해석으로 인한 오류 감소

마커를 드래그하여 "정확히 100단어, 그 이상은 안 됨" 에 대한 예측을 배치하세요. 활성화되는 패널이 주의해야 할 점을 알려줍니다.

조종 가능성은 모델이 당신의 지시를 따르는 능력입니다. "표로 응답하세요"라고 하면 표가 나오고, 역할, 어조, 형식, 단어 제한을 지정하면 모델이 이를 적용합니다—종종 첫 번째 시도에서. 이것은 자동으로 이루어진 것이 아닙니다: 파인튜닝은 모델이 좋은 어시스턴트 행동의 엄선된 예시에서 학습하는 두 번째 훈련 단계로, 당신의 텍스트를 요청으로 처리하고 설정한 규칙을 따르는 습관을 익힙니다. 그러나 조종 가능성은 이해와 동일하지 않습니다. 모델은 다른 모든 것에 사용하는 동일한 패턴 완성 엔진을 통해 지시를 따르므로, 당신이 타이핑한 단어와 의도 사이에는 항상 간격이 있습니다. "100단어 이내, 간결하게"를 요청하면 정확히 그것을 얻을 수 있지만—실제로 필요했던 미묘한 발견이 요약을 덜 간결하게 만든다는 이유로 삭제될 수 있습니다. 지시는 문자 그대로 이행되었지만, 당신이 의미했던 것은 놓쳤습니다.

지시를 스펙트럼 위에 배치해 보세요. 짧고 구체적이며 확인 가능한 방향—"표로 응답", "100단어 이내", "이 정확한 스키마 사용"—은 역량 구역에 확실히 자리합니다: 패턴이 매칭하기 쉽고 한눈에 확인할 수 있습니다. 긴 추론 체인, "통찰력 있게"와 같은 추상적 요청, 또는 기본 수치 정밀도가 필요한 것으로 이동할수록 통제력이 약해집니다. 특징적인 실패 사례:

  • 추론 편향 —긴 체인에서 작은 오류가 누적되고 모델은 이를 인식하지 못합니다.
  • 문자적 해석 —지시는 문자 그대로 이행되지만 쓸모없는 결과를 냅니다.
  • 프롬프트 인젝션 —모델이 텍스트에 내포된 지시를 따르기 때문에, 문서 내에 숨겨진 악의적인 지시도 따를 수 있습니다. 일상적인 문제보다는 보안 우려 사항이지만, 존재한다는 것을 알아두는 것이 좋습니다.

제품 기능은 이러한 간격을 좁혀줍니다: 시스템 프롬프트는 대화가 길어져도 희석되지 않는 고정 지시를 제공하고, 가시적 추론은 최종 답변이 아닌 2단계에서 편향을 포착하게 해주며, 구조화된 출력 모드는 문자적 해석으로 인한 오류를 줄여줍니다. 당신의 기법도 중요합니다: 단계와 함께 목표를 명시하고, 검증할 수 있는 체크포인트로 긴 체인을 나누고, 지시가 문자 그대로 이행되지만 쓸모없을 때는 지시가 아닌 목표를 다시 진술하세요—"간결하게"를 더 강하게 반복해도 실제로는 의도의 문제였던 간결성 문제를 해결하지 못합니다.

핵심 요점

  • 조종 가능성 은 모델이 다음 토큰 예측을 통해 지시를 따른다는 것을 의미합니다.
    • 역량 구역: 짧고 구체적이며 검증 가능한 지시. 형식 명세, 길이 제한, 명시적 역할.
    • 한계 구역: 긴 추론 체인, 추상적이거나 모호한 지시, 기본 수치 또는 논리적 정밀도가 필요한 모든 것.
    • 특징적 실패: 추론 편향(작은 오류가 누적됨)과 문자적 해석(지시는 이행되었지만 의도는 놓침).
    • 시스템 프롬프트, 코드 실행, 가시적 추론, 구조화된 출력 모드 는 당신의 의도가 희석되지 않도록 존재합니다.
    • 지시가 문자 그대로 이행되지만 쓸모없을 때는 목표를 다시 진술하세요. 지시를 더 강하게 반복해도 간격을 좁히지 못합니다.
  • 4D 연결: 조종 가능성은 설명을 강력하게 만들면서 동시에 그것을 제한하는 것입니다. 단어와 의도 사이의 간격을 이해하면 프롬프트를 작성하는 방식과 체크포인트를 삽입하는 위치가 달라집니다.

연습 문제

연습: 목표 재작성

왜 이 연습을 하나요? 당신이 말하는 것과 의미하는 것 사이의 간격이 대부분의 조종 가능성 실패가 발생하는 곳입니다. 이 연습은 지시가 아닌 의도로부터 프롬프트하는 법을 가르칩니다.

수업 1 목록에서 여러 단계 또는 특정 출력 형식을 포함하는 작업을 선택하세요. 목표를 한 문장으로 적어보세요: 출력이 어떻게 보여야 하는지가 아니라, 실제로 달성하려는 것. ("팀에게 이 일정이 현실적임을 납득시키기"는 목표입니다. "세 개의 글머리표"는 형식입니다.)

이제 세 가지 탐색을 실행하세요:

  1. 탐색 1: 강한 통제. 작업과 관련된 짧고 구체적이며 검증 가능한 지시를 주세요: "3열 표로 응답", "정확히 다섯 개의 글머리표", "전체에 걸쳐 2인칭". 정확히 유지되었는지 확인하세요. 이것이 역량 구역입니다: 지시가 완벽하게 패턴 매칭할 수 있을 만큼 단순합니다.
  2. 탐색 2: 추론 편향. 4~5개의 종속 단계가 필요한 작업 버전을 요청하세요. 단계별로 출력을 검토하세요. 초기의 작은 오류가 끝까지 이어졌나요? 이제 다시 시도해보되, AI에게 계속하기 전에 2단계의 결과를 멈추고 보여달라고 요청하세요. 체크포인트를 삽입할 때와 그냥 실행할 때의 결과를 비교하세요.
  3. 탐색 3: 문자 vs. 정신. 문자 그대로 충족될 수 있지만 쓸모없는 지시를 주세요. 실제 문제가 구조인 초안에 "이것을 더 짧게". 실제 문제가 요청을 묻어버리는 것인 이메일에 "이것을 더 전문적으로". 결과를 확인하세요. 그런 다음 지시와 함께 목표를 명시적으로 진술하여 다시 프롬프트하세요: "이것을 더 짧게. 내 목표는 2페이지의 핵심 발견을 통해 임원의 관심을 유지하는 것입니다." 비교해보세요.

작업 목록으로 돌아가세요. 다단계 작업의 경우, 체크포인트를 어디에 삽입할지 메모하세요. 형식만으로 프롬프트해온 작업의 경우, 다음에 추가할 목표 진술문 초안을 작성하세요.

수업 돌아보기

  • 형식은 진술했지만 목표는 진술하지 않은 경우가 얼마나 자주 있었나요? 둘 다 포함하면 무엇이 달라지나요?
  • 이번 주부터 중간 과정 체크포인트를 추가할 반복 작업이 하나 있다면 무엇인가요?

다음 내용

이제 네 가지 속성을 모두 개별적으로 살펴보았습니다. 다음 수업에서는 그것들이 어떻게 상호작용하는지 살펴봅니다. 실제 세계의 실패 대부분은 두 속성이 만나는 지점에서 발생하기 때문입니다.

피드백

강좌를 진행하면서 강좌의 개념을 업무에 어떻게 활용하고 있는지, 그리고 의견이 있으시면 알려주세요. 피드백을 여기 에서 공유해 주세요.

감사의 말 및 라이선스

Copyright 2026 Anthropic. Rick Dakan 교수(링글링 예술 디자인 대학)와 Joseph Feller 교수(코크 대학교)가 개발한 AI 유창성 프레임워크를 바탕으로 한 원저작물. CC BY-NC-SA 4.0 라이선스 하에 배포.