Anthropic downgraded cache TTL on March 6th

개요

2026년 1월 11일부터 4월 11일까지 Claude Code 세션 JSONL 파일을 분석한 결과, Anthropic이 2026년 3월 초에 프롬프트 캐시 TTL(Time To Live) 기본값을 1시간에서 5분으로 변경한 것으로 추정됩니다.

주요 내용

  • 캐시 TTL 기본값 변경: 분석 데이터에 따르면, 2026년 3월 6일경 Anthropic은 Claude Code의 캐시 TTL 기본값을 1시간에서 5분으로 변경했습니다. 변경 이전에는 1시간 TTL이 사용되었습니다.
  • 비용 증가: 5분 TTL로의 변경은 캐시 생성 비용을 20~32% 증가시켰으며, 이전에는 제한에 도달하지 않았던 구독 사용자들의 쿼터 사용량 급증을 유발했습니다.
  • 데이터 분석: 2026년 1월 11일부터 4월 11일까지 두 개의 독립적인 머신(Linux 워크스테이션, Windows 노트북)에서 총 119,866건의 API 호출 데이터를 분석했습니다. 각 어시스턴트 메시지의 usage.cache_creation 필드를 통해 TTL 계층별 사용량을 관찰할 수 있었습니다.
  • 단계별 변화:
  • 1단계(1월 11일-31일): 5분 TTL만 관찰되었습니다.
  • 2단계(2월 1일-3월 5일): 1시간 TTL만 사용되었습니다. 이 기간 동안 5분 TTL 관련 비용이 0%였습니다.
  • 3단계(3월 6일-7일): 5분 TTL이 다시 나타나기 시작하며 혼합 사용이 관찰되었습니다.
  • 4단계(3월 8일-4월 11일): 5분 TTL이 지배적이 되었습니다.
  • 비용 및 쿼터 영향: 5분 TTL은 세션 중 5분 이상 활동이 없을 경우 캐시가 만료되어 재업로드해야 하므로, 특히 긴 코딩 세션에서 비용 부담을 가중시킵니다. 5분 TTL은 1시간 TTL보다 캐시 쓰기 비용이 12.5배 더 비쌉니다. 또한, 캐시 생성 토큰은 쿼터에 전체 속도로 계산되어 구독 사용자들의 쿼터 소진을 가속화할 수 있습니다.
  • 예상 원인: 1시간 TTL이 의도된 기본값이었으며, 2026년 2월 27일에서 3월 8일 사이에 Anthropic이 서버 측 설정을 변경했을 가능성이 높습니다. 이는 비용 절감을 위한 의도적 변경이거나 인프라 회귀일 수 있습니다.

시사점

Anthropic의 Claude Code 캐시 TTL 기본값 변경은 사용자 비용 증가 및 쿼터 소진 가속화라는 실질적인 영향을 미쳤으며, 1시간 TTL이 원래 의도된 기본값이었다는 강력한 증거가 제시되었습니다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions