When Control Becomes Authority: Calibration Governance in STEM BIO-AI 1.7.x
개요
STEM BIO-AI 1.7.x 라인의 새로운 버전은 단순히 점수 계산을 넘어, 제어(control)가 권위(authority)가 되는 지점을 명확히 구분하는 캘리브레이션 거버넌스(Calibration Governance) 문제를 해결하는 데 중점을 둡니다.
주요 내용
- 캘리브레이션 문제의 발생: STEM BIO-AI 초기 버전은 AI 저장소의 observable surface를 스캔하여 점수를 계산하는 데 집중했지만, 다양한 관련 신호들이 점수에 영향을 미치면서 점수의 권위가 모호해지는 문제가 발생했습니다.
- STEM BIO-AI 1.7.x의 설계 목표: 연구자가 리뷰 태도를 표현하고, 운영자가 정책 변경을 시뮬레이션하며, 정책 메타데이터를 아티팩트에 공개할 수 있도록 하면서도, 이러한 입력이 공식 점수를 무단으로 변경하지 못하도록 하는 것을 목표로 합니다.
- STEM BIO-AI의 현재 기능 (v1.7.5 기준):
* 패키지화된 캘리브레이션 프로파일, 스키마 및 런타임 유효성 검사.
* 정책 목록, 설명, 파생, 시뮬레이션 기능을 제공합니다.
* 시뮬레이션용 로컬 프로파일 파일 및 프로파일 해시, 읽기 모드 메타데이터를 아티팩트에 포함합니다.
* 명시적인 권장 프로파일은 strict_clinical_adjacency이며, reproducibility_first는 초안 상태입니다.
* 권위 있는 스캔 점수 경로는 사용자 제공 프로파일 변경으로부터 보호되며, 로컬 프로파일 파일은 stem policy simulate에서만 mirror_only로 작동합니다.
- 캘리브레이션의 역할: 캘리브레이션은 단순한 튜닝 콘솔이 아니라, 연구자가 도메인 지식을 표현하면서도 공식 점수 경계를 명확하고 버전 관리되며 우발적으로 변경하기 어렵게 유지하는 데 목적이 있습니다.
- 1-5 스케일의 입력 방식: 사용자 입력은 1-5 스케일을 사용하지만, 이는 점수 상수가 아닌 명시적 규칙을 통해 변환되는 UX 입력 표면입니다.
- CLI 기능의 제한: stem policy derive 및 stem policy simulate는 예측을 위한 예측 표면을 제공하지만, stem scan에서의 임의적인 가중치/캡 변경과 같은 직접적인 점수 수정은 허용하지 않습니다. 이는 "쉬운 실험, 어려운 드리프트(easy experimentation, hard drift)" 원칙을 따릅니다.
- 검증 가능한 변경 사항: 임의 점수 튜닝 차단, 숨겨진 프로파일 변조 방지, 불분명한 프로파일 ID 방지, 자문 AI의 점수 대체 방지, 재현성 과대평가 방지, 조기 명명된 프로파일 확장 방지, 탐지기 승격 드리프트 방지 등을 검증 대상으로 합니다.
- B2 (편향 및 한계 측정) 예시: 단순 어휘 언급만으로는 부분 점수를 주던 이전 방식에서, 이제는 구조화된 한계 섹션, 정량적 분석 등 보다 엄격한 기준을 적용하여 점수 경로에 실질적인 변화를 가져왔습니다.
- Stage 4 (재현성)의 분리 유지: 재현성 신호는 중요하지만, 공식 점수 권위와는 분리하여 유지합니다. 재현성이 높은 저장소라도 임상적 주장에는 약점이 있을 수 있기 때문입니다.
- 자문 AI 적용: 자문 AI는 정보를 해석하고 검토를 우선순위화하는 데 도움을 줄 수 있지만, 결정론적 스캐너의 공식 점수를 직접적으로 덮어쓸 수는 없습니다.
- 점수 도구에서 감사 워크플로우로의 전환: 1.7.x 버전은 저장소의 점수뿐만 아니라, 점수에 영향을 미친 요소, 제외된 요소 등을 추적하는 감사 워크플로우 중심으로 전환되고 있습니다.
- 향후 버전 방향: 다음 단계는 기본 정책 프로파일을 읽기 모드로 전환하고, 기존 픽스처에서 점수나 티어 변경이 없도록 하며, 비기본 프로파일은 계속 예측 표면으로 유지하는 것입니다.
시사점
STEM BIO-AI 1.7.x는 제어 기능이 무비판적으로 권위로 전환되는 것을 방지함으로써, AI 리뷰 시스템의 신뢰성과 감사 가능성을 높이는 데 기여할 수 있습니다.
댓글
GitHub Discussions