I Built an Open Source AI Workspace for Paperless-ngx Because I Wanted Document Intelligence
개요
Taan Mind는 Paperless-ngx를 기반으로 개발된 오픈소스 AI 워크스페이스로, 문서 아카이브가 파일 내용을 이해하고 메타데이터를 추출하며 OCR 콘텐츠를 풍부하게 만드는 것을 목표로 합니다.
주요 내용
- 문서 지능의 필요성: 개발자 및 소규모 팀에서 발생하는 방대한 양의 PDF, 메모, 계약서 등 다양한 문서들을 Paperless-ngx와 같은 도구로 정리하더라도, 파일 내용을 AI가 이해하고 활용하는 '문서 지능'의 부재를 느껴 Taan Mind 프로젝트가 시작되었습니다.
- Taan Mind의 핵심 목표: 문서 아카이브가 파일을 이해하고, 수동 검색이나 전체 PDF 읽기 대신 AI가 메타데이터를 추출하고 OCR 콘텐츠를 풍부하게 만들며, 파일과의 대화를 연결하고, 로컬 우선(local-first) AI 모델과 함께 작동하며, 자체 호스팅 및 개인 정보 보호에 중점을 두는 워크스페이스를 제공하는 것입니다.
- 구축 이유 (개인 정보 보호 및 자체 호스팅): 많은 AI 문서 도구가 민감한 파일을 외부 클라우드 서비스에 업로드해야 하는 반면, Taan Mind는 Ollama, 로컬 LLM, Docker 등 자체 호스팅 인프라에서 작동하여 개발자, 자체 호스터, 연구원, 개인 데이터 취급 기업 등의 요구사항을 충족시킵니다.
- 현재 기능: AI 기반 문서 컨텍스트 채팅, OCR 처리 파이프라인, 메타데이터 풍부화, KPI 대시보드, Paperless-ngx 통합, Ollama를 통한 로컬 우선 모델 지원, 다중 제공업체 AI 지원, Docker 준비된 배포 기능을 포함합니다.
- 기술 스택:
- 프론트엔드: Nuxt 4, Nuxt UI, Tailwind CSS, AI SDK
- 백엔드/기타: Ollama, MuPDF, SQLite, Drizzle ORM, Docker Compose
- 개발의 어려움: 개인 정보 보호, 성능, OCR 품질, AI 컨텍스트 주입, 로컬 모델 실행 간의 균형을 맞추는 것이 핵심 과제였으며, 향후 통합을 위한 모듈식 아키텍처를 유지하는 데 중점을 두었습니다.
- 오픈소스 결정 이유: 문서 AI는 투명해야 하며, 사용자는 코드를 검사하고, 로컬에서 실행하며, 공급업체를 사용자 정의하고, 모델을 선택하고, 데이터를 소유할 수 있어야 한다는 믿음 때문입니다. 또한, Ollama, Open WebUI, Paperless-ngx와 같은 프로젝트를 통해 커뮤니티 중심 도구의 강력함을 확인했습니다.
- 가장 놀라웠던 점: AI 자체보다 자체 문서와 상호작용하는 더 나은 방법을 찾는 사람들의 수가 많다는 점에 놀랐으며, 이는 단순한 "PDF와 채팅" 데모가 아닌 실제 워크플로우(문서 구성, 검색 가능한 아카이브, OCR 파이프라인, 메타데이터 자동화, AI 지원 지식 검색)에 대한 수요가 있음을 보여줍니다.
- 향후 계획: 향상된 RAG 파이프라인, MCP 통합, 워크플로우 자동화, 시맨틱 검색 개선, 로컬 모델 최적화, 협업 문서 워크플로우 등을 계획하고 있습니다.
시사점
Taan Mind는 자체 호스팅 및 개인 정보 보호를 중시하며 문서 아카이브에 실제적인 AI 지능을 부여하고자 하는 사용자들에게 실용적인 솔루션을 제공하며, 오픈소스 생태계를 통해 투명하고 사용자 중심적인 문서 AI 발전에 기여할 가능성이 있습니다.
원문을 불러오는 중...
댓글
GitHub Discussions