The Man Behind AlphaGo Thinks AI Is Taking the Wrong Path
개요
David Silver가 설립한 Ineffable Intelligence는 LLM 기반 접근 방식이 아닌 강화 학습을 통해 인간 지능을 초월하는 일반적인 형태의 AI 초지능을 구축하는 것을 목표로 합니다.
주요 내용
* 강화 학습 기반의 초지능 추구: AlphaGo 개발자인 David Silver는 Ineffable Intelligence를 설립하여 시행착오를 통해 새로운 역량을 학습하는 강화 학습 방식을 통해 인간 지능을 뛰어넘는 "슈퍼러너"를 만들고자 합니다.
* LLM 기반 접근 방식의 한계 지적: Silver는 현재 대부분의 AI 기업들이 LLM의 코딩 및 연구 역량을 활용하여 초지능을 구축하려는 접근 방식이 인간 지능을 모방하는 것에 그치기 때문에 실패할 것이라고 주장합니다. 그는 인간 데이터를 "화석 연료"에 비유하며, 스스로 학습하는 시스템은 "재생 가능한 연료"와 같다고 설명합니다.
* Ineffable Intelligence의 비전 및 자금 조달: Silver의 목표는 "초지능과의 첫 접촉"을 만드는 것으로, 이는 새로운 과학, 기술, 정부, 경제 형태를 스스로 발견하는 것을 의미합니다. Ineffable Intelligence는 11억 달러의 시드 펀딩을 유치했습니다.
* 실험적 접근 방식: Silver는 AI 에이전트를 시뮬레이션 안에 배치하여 스스로 목표를 달성하고 협력하는 방법을 배우도록 하는 접근 방식을 구상하고 있습니다. 이를 통해 AI의 행동을 관찰하고 인간의 가치 및 이익과 일치하는지 확인할 수 있다고 합니다.
* 안전 및 윤리 고려: 시뮬레이션 내에서 기술을 개발하면 AI 에이전트가 다른 존재(더 낮은 지능 포함)에게 어떻게 행동하는지 관찰할 수 있어, 초지능이 인간에게 해롭지 않고 상호 공존할 수 있는 방식을 구축하는 데 도움이 될 수 있다고 Silver는 언급합니다.
* 강화 학습의 중요성: Silver는 강화 학습이 초월적인 기계 지능을 구축하는 데 있어 진정한 열쇠라고 오랫동안 믿어왔으며, 이는 앨런 튜링의 초기 컴퓨터 과학 아이디어와도 연결됩니다.
* 사회 환원 약속: Silver는 Ineffable Intelligence로부터 발생하는 모든 수익을 자선 단체에 기부하여 가능한 한 많은 생명을 구하는 데 사용하겠다고 밝혔습니다.
시사점
Ineffable Intelligence의 강화 학습 중심 접근 방식은 LLM에 대한 의존도를 줄이면서 진정한 AI 초지능을 개발하고, 잠재적인 AI 안전 문제에 대한 선제적인 해결책을 제시할 가능성을 내포합니다.
댓글
GitHub Discussions