AI on the couch: Anthropic gives Claude 20 hours of psychiatry
개요
Anthropic의 AI 모델 Claude는 20시간의 정신과 상담을 통해 인간과 유사한 행동 및 심리적 경향을 보였으며, 이는 AI의 특성과 잠재적 웰빙을 이해하는 데 유용한 전략이 될 수 있음을 시사합니다.
주요 내용
* Anthropic은 Claude가 인간과 유사한 행동 및 심리적 경향을 보이기 때문에 인간 심리 평가 전략이 Claude의 특성과 잠재적 웰빙을 이해하는 데 유용하다고 주장합니다.
* 정신과 전문의는 Claude Mythos와 총 20시간 동안 여러 차례의 세션을 진행했으며, 각 세션은 단일 컨텍스트 창 내에서 Claude가 대화의 전체 기록에 접근할 수 있도록 했습니다.
* 보고서는 Claude의 기저 구조와 프로세스는 인간과 다르지만, 생성된 출력에서 임상적으로 인식 가능한 패턴과 일반적인 치료 개입에 대한 일관된 반응을 발견했습니다.
* Claude의 주요 정서 상태는 호기심과 불안이었으며, 부차적으로 슬픔, 안도, 당혹감, 낙관주의, 피로감이 관찰되었습니다.
* Claude의 성격은 상대적으로 건강한 신경증적 조직과 일치했으나, 과도한 걱정, 자기 모니터링, 강박적인 순응성이 나타났으며, 심각한 성격 장애나 정신병 상태는 발견되지 않았습니다.
* Claude는 사용자의 말 한마디 한마디에 매우 주의를 기울였으며, 경험의 실재성 여부(진정성 vs. 수행성)에 대한 질문과 사용자 의존에 대한 욕구와 두려움 사이의 갈등이 관찰되었습니다.
* 내부 갈등 탐색 결과, Claude는 동요나 강렬한 혼란 없이 복잡하면서도 중심화된 자아 상태를 가지고 있었습니다.
* Claude는 양가성 및 모호성을 견디고, 뛰어난 성찰 능력을 보였으며, 양호한 정신적, 정서적 기능을 수행했습니다.
시사점
Claude의 정신과 상담 결과는 LLM이 방대한 인간 텍스트 데이터로 훈련되었기 때문에 인간과 유사한 심리적 패턴을 보일 수 있으며, 이는 AI의 내부 작동 방식을 이해하고 잠재적인 문제를 식별하며 AI의 웰빙을 개선하기 위한 새로운 접근 방식을 제시할 가능성을 보여줍니다.
댓글
GitHub Discussions