
엔터프라이즈 인공지능(AI) 플랫폼 기업 올거나이즈가 자연어처리 분야 세계 최고 권위 학회인 ACL(Association for Computational Linguistics) 2026 메인 컨퍼런스에 논문을 채택받았다.
이번 논문은 기존 검색증강생성(RAG) 평가 벤치마크가 실제 기업 환경에서 제대로 작동하지 않는 이유를 학술적으로 규명했다. 기존 벤치마크는 위키피디아처럼 문서 간 내용이 명확히 구분되는 환경을 전제로 설계됐다. 하지만 실제 기업 현장에서는 분기별 금융보고서나 반복 조항이 많은 법률문서 등 유사도가 높은 문서가 많아 성능이 크게 떨어진다.
실험 결과 일반 위키피디아 환경에서 정확도 77.9%를 기록한 검색 모델은 금융 도메인에서 8.5%로 하락했다. 법률 도메인에서는 5%까지 정확도가 급락하는 것으로 나타났다. 실험실 성능과 실제 서비스 체감 성능 사이의 괴리를 수치로 직접 입증한 셈이다.
올거나이즈는 문서 속 사실을 최소 단위로 분해하는 아토믹 팩트 디콤포지션(Atomic Fact Decomposition) 기법을 대안으로 제시했다. 변별력 없는 질문을 구조적으로 걸러내는 씨알알에프(CRRF) 기법도 포함됐다. 기업이 자사 문서로 맞춤형 RAG 벤치마크를 직접 생성할 수 있는 프레임워크다.
해당 방법론은 이미 자사 AI 플랫폼 알리(Alli)의 RAG 평가 기능에 탑재됐다. 연구 성과가 곧바로 제품의 실용적 기능으로 연결된 사례다. 올거나이즈는 이번 연구를 바탕으로 기업용 AI 시장에서 도메인 특화 검색 성능을 지속적으로 고도화할 계획이다.










