.png)
2025
[ RAG 기반 교통사고 과실비율 분석 서비스 개발 ]
1. 문제 정의: 정보 비대칭과 LLM의 한계를 동시에 해결
- 사용자 문제:
교통사고 발생 시, 복잡한 법률 정보와 방대한 판례 속에서 일반 사용자가 자신에게 유리한 정보를 찾기 어려워 보험사와의 협상에서 불리한 위치에 놓이는 문제가 있었습니다.
- 기술적 문제: LLM을 그대로 활용할 경우, 개인정보보호 이슈와 더불어 부정확한 정보를 생성하는 '환각(Hallucination)' 현상으로 인해 법률 정보처럼 신뢰성이 중요한 도메인에 적용하기 어려운 한계가 있었습니다.
2. 접근법 및 실험 과정: 내부 DB 기반 RAG 아키텍처 설계 및 구축
- 접근법: 외부 검색에 의존하지 않고, 신뢰성이 확보된 내부 판례 데이터베이스(MariaDB)를 구축하여 RAG(검색 증강 생성) 파이프라인을 설계했습니다.
이는 LLM의 환각 현상을 제어하고, 개인정보를 보호하며, 도메인에 특화된 정확한 답변을 생성하기 위한 최적의 접근법이었습니다.
- 실험 과정:
- Phase 1 (지식 베이스 구축): 여러 테이블로 나뉜 판례, 사고 유형, 과실 가감 요소 데이터를 SQL JOIN으로 통합하여 의미 있는 '지식 문서'를 생성했습니다. 이후 임베딩 모델을 통해 벡터로 변환하고, 빠른 검색을 위해 Vector DB(FAISS)에 인덱싱하여 지식 베이스를 구축했습니다.
- Phase 2 (실시간 분석): 사용자가 자연어로 사고 상황을 입력하면, 이를 벡터로 변환하여 FAISS에서 가장 유사한 판례 문서를 K개 검색합니다. 검색된 문서(Context)와 사용자 질문을 조합하여 LLM(Qwen)에 전달, 주어진 '지식'만을 기반으로 답변을 생성하도록 유도하여 환각을 최소화했습니다.
3. 성능 개선 내용:
- 신뢰성 확보: RAG 아키텍처를 통해 LLM이 생성하는 답변의 근거를 내부 판례 데이터로 한정시켜, 법률적 판단에 요구되는 높은 수준의 신뢰성을 확보했습니다.
- 사용자 경험 개선: 복잡한 법률 용어 없이, 자연어 대화만으로 즉시 예상 과실비율과 관련 판례를 제공하여 정보 비대칭 문제를 해결하고 사용자 불안감을 해소했습니다.
- 확장성 설계: 모든 기능을 FastAPI 기반의 API 엔드포인트로 모듈화하여, 향후 블랙박스 영상 분석 연동이나 보험사 시스템 통합 등 서비스 확장이 용이하도록 시스템을 설계했습니다.
2024
[ IoT device data 자동화 처리 ]
디바이스 데이터 처리 자동화 프로젝트
[ 날씨 예측 ]
날씨 데이터 예측 ; Lightgbm & k-fold 이용