HADEULSOFT
CompanyServicesPortfolioNewsCareersInquiryKR
KR

AI 코랩샵 에이전트 - 이화학 장비 채팅 에이전시

Client : 코라이 사이언스
AI AgentWeb
Next.jsTypeScriptPostgreSQLpgvectorpg_trgmPrisma+13

390,000개 이상의 이화학 시약·장비 데이터를 AI가 이해하고, 연구원의 자연어 질문에 정확한 상품을 추천하는 도메인 특화 E커머스 AI 에이전트입니다. CAS 번호, 순도, 제조사 등 전문 역질문을 통해 사람 수준의 상담을 24시간 제공합니다.

Image 1
Image 2
Image 3
Image 4
Image 5

System Architecture

Client Layer
Frontend
Next.js · React
App UI Framework
UI System
Tailwind CSS
Lucide React · Markdown
API Layer
Backend API
Next.js API Routes
TypeScript 5 · REST API
API Security
JWT Authentication
Rate Limiting Middleware
RAG / Intelligence Layer
Query Router
질의 분류 및 라우팅
Keyword · Semantic · Hybrid
Retrieval
Hybrid Search
Keyword + Vector + Reranking
Response Guard
Hallucination Detection
신뢰도 검증 및 보정
AI Processing Layer
Embedding
MiniLM 384dim
Xenova · sentence-transformers
OCR
PaddleOCR
문서 이미지 텍스트 추출
Python Services
PyTorch 기반 처리
NumPy · Pillow · psycopg2
Data Layer
Primary DB
MySQL · Prisma
운영 데이터 관리
Search DB
pgvector · pg_trgm
HNSW Index 기반 검색
Processing
xlsx · CSV · PDF Parser
문서 수집 및 정제
Infrastructure / Security
Infrastructure
Docker· Nginx
보안 인프라
Caching
In-Memory LRU Cache
TTL 기반 응답 최적화
Security Stack
bcryptjs · JWT
인증 · 토큰 · 환경변수 관리

Project Detail

# AI Kolabshop Aigents — Project Detail

## 프로젝트 개요

AI Kolabshop Aigents는 이화학·시약 전문 B2B 커머스 플랫폼에 특화된 AI 상담 에이전트입니다. 395,820개 상품 데이터를 벡터 임베딩하여 AI가 깊이 이해하고, 연구원의 복잡한 구매 상담을 전문 상담원 수준으로 24시간 무중단 제공합니다.

---

## 핵심 기능

### 하이브리드 검색 엔진

키워드 검색(pg_trgm)과 시맨틱 검색(pgvector + HNSW)을 결합하여, 395,820개 상품에서 고객 의도에 가장 부합하는 결과를 찾아냅니다.

- **Reciprocal Rank Fusion** 알고리즘으로 두 검색 결과를 최적 결합
- **쿼리 라우터**가 CAS 번호, 모델번호, 자연어 질문을 자동 감지하여 검색 전략 동적 선택
- **Reranker**가 제조사 우선순위, 품질 지표 기반으로 상위 결과 재순위화
- 검색 결과 캐싱으로 응답 속도 최적화

### 도메인 특화 역질문

시약 상담 시 순도, CAS 번호, 용량, 제조사를 자동으로 역질문하여 전문 상담원 수준의 상담을 수행합니다.

```
고객: "에탄올 필요해요"
AI:   "어떤 순도의 에탄올이 필요하신가요?
       분석용(99.5%)인지, 일반용(95%)인지 알려주시면
       정확한 상품을 추천해 드리겠습니다."
```

Few-shot 대화 예시를 학습하여 역질문 → CAS 특정 → 견적 요청까지 자연스러운 상담 흐름을 구현합니다.

###  멀티턴 맥락 유지

- 지시대명사, 번호 참조, 속성 질문 등 20+ 후속 질문 패턴 인식
- 이전 대화의 CAS 번호, 제조사 선호도를 기억하고 후속 질문에 반영
- Quick Response 시스템으로 간단한 응답은 LLM 호출 없이 즉시 처리

###  상담 유형 자동 감지

50개 이상의 상담 패턴을 인식하여 최적의 플로우를 제공합니다.

| 상담 유형 | 대응 플로우 |
|-----------|------------|
| 구매대행 | 전문 상담원 연결 |
| 견적 요청 | 견적서 발급 + 상담 폼 |
| 서류 발급 | MSDS, CoA 등 절차 안내 |
| 특수 주문 | OEM/맞춤제작 프로세스 안내 |

복수 상품 CSV/폼 파서를 내장하여 대량 구매 요청도 일괄 처리합니다.

5단계 LLM 체인으로 특정 모델 장애 시에도 무중단 서비스를 보장합니다.

###  GPU 가속 임베딩 파이프라인

- CUDA 기반 GPU 가속으로 395,820개 상품 벡터 임베딩 생성
- 384차원 다국어 임베딩 모델, HNSW 인덱스 튜닝
- 증분 동기화 파이프라인으로 신규 상품·가격 변동 자동 반영

###  엔터프라이즈급 보안 체계

모든 요청에 5단계 통합 보안 체크를 순차 적용합니다.

```
Rate Limiting → 프롬프트 인젝션 탐지 → 남용 패턴 탐지 → 토큰 제한 → 메시지 정제
```

- **Rate Limiting**: IP 기반 요청 제한, 초과 시 자동 차단
- **프롬프트 인젝션 탐지**: 시스템 프롬프트 탈취, 역할 변경, 탈옥 시도 등 차단
- **남용 패턴 탐지**: 중복 메시지, 연속 빠른 요청 감지
- **토큰 제한**: 세션별·글로벌 일일 토큰 사용량 제한
- **오프토픽 필터링**: IT/개발, 잡담, 스팸, 공격 등 20+ 카테고리 200+ 패턴 필터

###  할루시네이션 다층 검증

LLM 응답의 신뢰도를 극대화하기 위한 12단계 검증 시스템을 운영합니다.

- 가짜 할인/재고/배송 정보 감지
- RAG 범위 외 가격·스펙·인증 정보 감지
- 비허용 도메인 URL 및 가짜 상품 링크 차단
- 감지 시 RAG 기반 폴백 응답으로 자동 대체

### 당일배송 & 스마트 추천

- 재고 현황 기반 당일배송 가능 상품 자동 추천
- 품절 시 동일 스펙 대체 상품 즉시 제안
- 브랜드 설명 자동 생성 시스템으로 제조사 신뢰도 향상

### 관리자 대시보드

- 상담 패턴 분석 및 검색 성능 모니터링
- LLM 상태 확인, 대화 이력 조회, 상담 신청 관리
- 제조사 우선순위·시스템 설정 관리
- JWT 기반 관리자 인증

---

## 아키텍처

### RAG 파이프라인

```
사용자 메시지
  → 보안 체크 (5단계)
  → Quick Response / 오프토픽 필터링
  → 상담 유형 감지
  → 쿼리 라우팅 (CAS / 모델번호 / 자연어)
  → RAG 검색 (키워드 + 시맨틱 + RRF + Reranker)
  → LLM 호출 (멀티 폴백)
  → 할루시네이션 검증 (12단계)
  → 상품 이미지 자동 삽입
  → 응답 반환 + 분석 데이터 비동기 기록
```

### Dual Database 구조

| 역할 | DB | 용도 |
|------|-----|------|
| 이커머스 | MySQL 8.0 | 쇼핑몰 (상품, 주문, 회원) |
| AI | PostgreSQL 15 | 벡터 검색, 대화 이력, 분석, 상담 |

MySQL → PostgreSQL 증분 동기화로 상품 데이터를 실시간 연동합니다.

---

## 프로젝트 성과

| 지표 | 수치 |
|------|------|
| QA 정확도 | **83.25%** (400건 벌크 테스트, 기존 74.7% → 8.5%p 개선) |
| 상품 벡터화 | **395,820개** (GPU 가속 임베딩) |
| 무중단 상담 | **24/7** (5단계 멀티 LLM 폴백) |
| 상담 패턴 인식 | **50+** (구매, 견적, 특수주문, 서류발급 등) |
| 오프토픽 필터 | **200+ 패턴, 20+ 카테고리** |
| 할루시네이션 검증 | **12단계** 다층 검증 |
| OCR 처리 | **65,638개** 상품 이미지 텍스트 추출 |
| 스펙 추출 | **4,907건** 구조화 스펙 추출 |

---

## 기술적 의의

**특수 도메인 RAG** — CAS 번호, IUPAC 화학명, 카탈로그 번호 등 도메인 특화 데이터를 벡터화하여 일반 LLM이 답변하기 어려운 정밀한 기술 상담을 구현. 한영 동의어 매핑으로 크로스 검색 지원.

**에이전트 워크플로우** — 쿼리 라우팅 → RAG 검색 → 역질문 → 상담 유형 감지 → 견적/상담 연결까지 전체 상담 워크플로우를 AI가 자율적으로 수행.

**할루시네이션 최소화** — 오프토픽 필터링, 12단계 할루시네이션 탐지, 이미지 후처리 분리 등 다층 검증으로 AI 답변 신뢰도 극대화. RAG에 없는 정보는 생성하지 않고 폴백 응답으로 자동 대체.

**실시간 지식 갱신** — 증분 동기화 파이프라인으로 신규 상품·가격 변동이 AI 검색에 자동 반영.
hadeulsoft.com

System Architecture

Client Layer
Frontend
Next.js · React
App UI Framework
UI System
Tailwind CSS
Lucide React · Markdown
API Layer
Backend API
Next.js API Routes
TypeScript 5 · REST API
API Security
JWT Authentication
Rate Limiting Middleware
RAG / Intelligence Layer
Query Router
질의 분류 및 라우팅
Keyword · Semantic · Hybrid
Retrieval
Hybrid Search
Keyword + Vector + Reranking
Response Guard
Hallucination Detection
신뢰도 검증 및 보정
AI Processing Layer
Embedding
MiniLM 384dim
Xenova · sentence-transformers
OCR
PaddleOCR
문서 이미지 텍스트 추출
Python Services
PyTorch 기반 처리
NumPy · Pillow · psycopg2
Data Layer
Primary DB
MySQL · Prisma
운영 데이터 관리
Search DB
pgvector · pg_trgm
HNSW Index 기반 검색
Processing
xlsx · CSV · PDF Parser
문서 수집 및 정제
Infrastructure / Security
Infrastructure
Docker· Nginx
보안 인프라
Caching
In-Memory LRU Cache
TTL 기반 응답 최적화
Security Stack
bcryptjs · JWT
인증 · 토큰 · 환경변수 관리

Project Detail

# AI Kolabshop Aigents — Project Detail

## 프로젝트 개요

AI Kolabshop Aigents는 이화학·시약 전문 B2B 커머스 플랫폼에 특화된 AI 상담 에이전트입니다. 395,820개 상품 데이터를 벡터 임베딩하여 AI가 깊이 이해하고, 연구원의 복잡한 구매 상담을 전문 상담원 수준으로 24시간 무중단 제공합니다.

---

## 핵심 기능

### 하이브리드 검색 엔진

키워드 검색(pg_trgm)과 시맨틱 검색(pgvector + HNSW)을 결합하여, 395,820개 상품에서 고객 의도에 가장 부합하는 결과를 찾아냅니다.

- **Reciprocal Rank Fusion** 알고리즘으로 두 검색 결과를 최적 결합
- **쿼리 라우터**가 CAS 번호, 모델번호, 자연어 질문을 자동 감지하여 검색 전략 동적 선택
- **Reranker**가 제조사 우선순위, 품질 지표 기반으로 상위 결과 재순위화
- 검색 결과 캐싱으로 응답 속도 최적화

### 도메인 특화 역질문

시약 상담 시 순도, CAS 번호, 용량, 제조사를 자동으로 역질문하여 전문 상담원 수준의 상담을 수행합니다.

```
고객: "에탄올 필요해요"
AI:   "어떤 순도의 에탄올이 필요하신가요?
       분석용(99.5%)인지, 일반용(95%)인지 알려주시면
       정확한 상품을 추천해 드리겠습니다."
```

Few-shot 대화 예시를 학습하여 역질문 → CAS 특정 → 견적 요청까지 자연스러운 상담 흐름을 구현합니다.

###  멀티턴 맥락 유지

- 지시대명사, 번호 참조, 속성 질문 등 20+ 후속 질문 패턴 인식
- 이전 대화의 CAS 번호, 제조사 선호도를 기억하고 후속 질문에 반영
- Quick Response 시스템으로 간단한 응답은 LLM 호출 없이 즉시 처리

###  상담 유형 자동 감지

50개 이상의 상담 패턴을 인식하여 최적의 플로우를 제공합니다.

| 상담 유형 | 대응 플로우 |
|-----------|------------|
| 구매대행 | 전문 상담원 연결 |
| 견적 요청 | 견적서 발급 + 상담 폼 |
| 서류 발급 | MSDS, CoA 등 절차 안내 |
| 특수 주문 | OEM/맞춤제작 프로세스 안내 |

복수 상품 CSV/폼 파서를 내장하여 대량 구매 요청도 일괄 처리합니다.

5단계 LLM 체인으로 특정 모델 장애 시에도 무중단 서비스를 보장합니다.

###  GPU 가속 임베딩 파이프라인

- CUDA 기반 GPU 가속으로 395,820개 상품 벡터 임베딩 생성
- 384차원 다국어 임베딩 모델, HNSW 인덱스 튜닝
- 증분 동기화 파이프라인으로 신규 상품·가격 변동 자동 반영

###  엔터프라이즈급 보안 체계

모든 요청에 5단계 통합 보안 체크를 순차 적용합니다.

```
Rate Limiting → 프롬프트 인젝션 탐지 → 남용 패턴 탐지 → 토큰 제한 → 메시지 정제
```

- **Rate Limiting**: IP 기반 요청 제한, 초과 시 자동 차단
- **프롬프트 인젝션 탐지**: 시스템 프롬프트 탈취, 역할 변경, 탈옥 시도 등 차단
- **남용 패턴 탐지**: 중복 메시지, 연속 빠른 요청 감지
- **토큰 제한**: 세션별·글로벌 일일 토큰 사용량 제한
- **오프토픽 필터링**: IT/개발, 잡담, 스팸, 공격 등 20+ 카테고리 200+ 패턴 필터

###  할루시네이션 다층 검증

LLM 응답의 신뢰도를 극대화하기 위한 12단계 검증 시스템을 운영합니다.

- 가짜 할인/재고/배송 정보 감지
- RAG 범위 외 가격·스펙·인증 정보 감지
- 비허용 도메인 URL 및 가짜 상품 링크 차단
- 감지 시 RAG 기반 폴백 응답으로 자동 대체

### 당일배송 & 스마트 추천

- 재고 현황 기반 당일배송 가능 상품 자동 추천
- 품절 시 동일 스펙 대체 상품 즉시 제안
- 브랜드 설명 자동 생성 시스템으로 제조사 신뢰도 향상

### 관리자 대시보드

- 상담 패턴 분석 및 검색 성능 모니터링
- LLM 상태 확인, 대화 이력 조회, 상담 신청 관리
- 제조사 우선순위·시스템 설정 관리
- JWT 기반 관리자 인증

---

## 아키텍처

### RAG 파이프라인

```
사용자 메시지
  → 보안 체크 (5단계)
  → Quick Response / 오프토픽 필터링
  → 상담 유형 감지
  → 쿼리 라우팅 (CAS / 모델번호 / 자연어)
  → RAG 검색 (키워드 + 시맨틱 + RRF + Reranker)
  → LLM 호출 (멀티 폴백)
  → 할루시네이션 검증 (12단계)
  → 상품 이미지 자동 삽입
  → 응답 반환 + 분석 데이터 비동기 기록
```

### Dual Database 구조

| 역할 | DB | 용도 |
|------|-----|------|
| 이커머스 | MySQL 8.0 | 쇼핑몰 (상품, 주문, 회원) |
| AI | PostgreSQL 15 | 벡터 검색, 대화 이력, 분석, 상담 |

MySQL → PostgreSQL 증분 동기화로 상품 데이터를 실시간 연동합니다.

---

## 프로젝트 성과

| 지표 | 수치 |
|------|------|
| QA 정확도 | **83.25%** (400건 벌크 테스트, 기존 74.7% → 8.5%p 개선) |
| 상품 벡터화 | **395,820개** (GPU 가속 임베딩) |
| 무중단 상담 | **24/7** (5단계 멀티 LLM 폴백) |
| 상담 패턴 인식 | **50+** (구매, 견적, 특수주문, 서류발급 등) |
| 오프토픽 필터 | **200+ 패턴, 20+ 카테고리** |
| 할루시네이션 검증 | **12단계** 다층 검증 |
| OCR 처리 | **65,638개** 상품 이미지 텍스트 추출 |
| 스펙 추출 | **4,907건** 구조화 스펙 추출 |

---

## 기술적 의의

**특수 도메인 RAG** — CAS 번호, IUPAC 화학명, 카탈로그 번호 등 도메인 특화 데이터를 벡터화하여 일반 LLM이 답변하기 어려운 정밀한 기술 상담을 구현. 한영 동의어 매핑으로 크로스 검색 지원.

**에이전트 워크플로우** — 쿼리 라우팅 → RAG 검색 → 역질문 → 상담 유형 감지 → 견적/상담 연결까지 전체 상담 워크플로우를 AI가 자율적으로 수행.

**할루시네이션 최소화** — 오프토픽 필터링, 12단계 할루시네이션 탐지, 이미지 후처리 분리 등 다층 검증으로 AI 답변 신뢰도 극대화. RAG에 없는 정보는 생성하지 않고 폴백 응답으로 자동 대체.

**실시간 지식 갱신** — 증분 동기화 파이프라인으로 신규 상품·가격 변동이 AI 검색에 자동 반영.

HADEULSOFT

CompanyServicesPortfolioNewsCareersInquiry

31 Daehak-ro, Yuseong-gu, Daejeon, Room 2118~2119, South Korea

Business Reg. No.: 244-81-01030   CEO: Kim Jae-sik

Copyright 2017. HADEULSOFT CO. LTD. ALL RIGHTS RESERVED.