Research repository ArXiv will ban authors for a year if they let AI do all the work

개요

ArXiv는 과학 논문에서 대규모 언어 모델(LLM)의 무분별한 사용을 방지하기 위해, LLM이 생성한 결과물을 검토하지 않은 저자에게 1년간의 ArXiv 이용 금지 조치를 취하는 정책을 시행한다.

주요 내용

* ArXiv는 컴퓨터 과학 및 수학 분야의 연구가 순환되는 주요 경로이자 과학 연구 동향의 데이터 소스로 활용된다.
* 기존에도 AI 생성 논문의 품질 저하 문제를 해결하기 위해 신규 투고자의 추천서 요구 등 조치를 시행해왔다.
* 토마스 디터리치(Thomas Dietterich), ArXiv 컴퓨터 과학 섹션 의장은 LLM 생성 결과물을 저자가 검토하지 않은 명백한 증거(예: 환각성 참고문헌, LLM과의 대화 기록)가 발견될 경우, 논문 전체의 신뢰성을 의심할 수 있다고 밝혔다.
* 이러한 증거가 발견된 논문의 저자는 1년간 ArXiv 이용이 금지되며, 이후에는 명망 있는 동료 검토 학술지에 먼저 게재된 후에 ArXiv에 투고할 수 있게 된다.
* 이는 LLM 사용 자체를 금지하는 것이 아니라, 저자가 생성 방식과 무관하게 콘텐츠에 대한 '전적인 책임'을 지도록 하는 정책이다. LLM에서 부적절한 언어, 표절, 편향된 내용, 오류, 부정확한 참고문헌, 오도하는 내용 등을 직접 복사-붙여넣기 할 경우, 저자는 이에 대한 책임을 져야 한다.
* 이 정책은 '원스트라이크 아웃' 방식이지만, 중재자가 문제를 신고하고 섹션 의장이 증거를 확인한 후에만 제재가 부과된다. 또한, 저자는 결정에 대해 항소할 수 있다.
* 최근 연구에 따르면, LLM으로 인해 생명 의학 연구에서 조작된 인용이 증가하는 추세이며, 이는 과학자뿐만 아니라 AI가 만들어낸 허위 인용을 사용하는 다른 분야에서도 나타나고 있다.

시사점

ArXiv의 새로운 정책은 LLM 시대에 과학적 무결성을 유지하고 연구 결과의 신뢰성을 확보하기 위한 실질적인 방안을 제시하며, 연구자들에게 AI 도구 사용에 대한 책임감을 강조한다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions