We Built a Custom Graph RAG to Let AI Answer "Did That Initiative Actually Work?"
개요
airCloset은 비즈니스 이니셔티브와 KPI 간의 관계를 그래프 구조로 표현하는 "Biz Graph"를 구축하여, AI가 "해당 이니셔티브가 실제로 효과가 있었는가?"라는 질문에 답할 수 있도록 했습니다.
주요 내용
* Graph RAG의 필요성: LLM의 컨텍스트 창에 모든 비즈니스 데이터를 담을 수 없기 때문에, 데이터 간의 관계를 명확히 하여 필요한 데이터를 적시에 검색하고 관계를 파악할 수 있는 Graph RAG가 효과적입니다.
* 비즈니스 데이터의 비정형성: 기존 데이터베이스 테이블과 달리, 이니셔티브와 KPI 간의 관계는 외래 키(FK)나 조인 키(join key)로 명확히 연결되지 않는 경우가 많아 그래프 구조 설계가 필요합니다.
* Biz Graph의 구성 요소:
* Week 노드: 이니셔티브와 KPI를 직접 연결하는 대신, 이니셔티브가 실행된 주(Week)와 KPI 데이터가 존재하는 주를 연결하는 방식을 채택하여 엣지 폭증을 방지하고, 인과 관계가 아닌 동시 발생을 표현하며, 데이터 소스 유형을 엣지 타입으로 구분하고, 시계열 탐색을 용이하게 합니다.
* MetricDomain: 이니셔티브 범주와 KPI 그룹 간의 암묵적인 관계를 구조화하여, 특정 이니셔티브와 관련된 KPI를 자동으로 필터링합니다.
* SIMILAR_TO 엣지: AI 임베딩을 활용하여 유사한 이니셔티브를 사전에 계산하고 연결하여, 과거 유사 사례 탐색을 용이하게 합니다.
* Biz Graph 구축 파이프라인: 데이터 수집, 노드 생성, 관계 정의, MetricDomain 생성 등 9단계로 구성되며, 특히 Week 노드와 MetricDomain 생성이 핵심적인 관계 구조화 과정입니다.
* BigQuery 활용: Neo4j와 같은 전용 그래프 DB나 OSS 라이브러리 대신, BigQuery를 사용하여 그래프 탐색, 시계열 분석, 벡터 검색 기능을 통합하고 운영 비용을 절감했습니다.
* 이니셔티브 데이터 수집: 회의 슬라이드에서 텍스트를 추출하고 AI를 통해 구조화하여 이니셔티브 데이터를 수집하며, 실행 시작일과 종료일을 정확히 파악하는 것이 중요합니다.
* 평가: Biz Graph는 기존 지식 그래프와 달리, 존재하지 않던 관계를 의도적으로 설계하고 이질적인 데이터 소스를 통합하여 탐색 가능한 구조를 만드는 데 중점을 둡니다.
시사점
Biz Graph는 비즈니스 데이터의 복잡한 관계를 효과적으로 구조화하고 AI 기반 분석 역량을 강화함으로써, 이니셔티브의 성과 측정 및 의사결정 효율성을 크게 향상시킬 수 있습니다.
댓글
GitHub Discussions