프로젝트
한국은행, 공통
사용자
관리자
버그의 증상
에러메세지를 찾기 어려움
버그의 증상 발생 빈도
토큰 초과하면 반드시 발생
적용된 버전 혹은 실험한 위치
1.3
전처리 입력 파일
No response
증상을 확인할 수 있는 step
증상
-
Enrichment 단계에서 vLLM/임의의 OpenAI-호환 API 호출 시, 토큰 초과로 오류가 발생해도 현재는 일반화된 실패 메시지만 남거나 Enrichment 작업하지 않은 결과로 나옴
-
운영/원인분석을 위해 공급자 에러 메세지를 그대로 “적재 상태 에러메세지” 필드에 저장 필요.
OpenAI-호환 에러 포맷(JSON)을 변형 없이 그대로 보존해 적재 상태 레코드의 에러 메시지 필드에 저장.
대표 예시:
{
"object": "error",
"message": "This model's maximum context length is 16384 tokens. However, you requested ...",
"type": "BadRequestError",
"param": null,
"code": 400
}
작업 항목
- Enrichment 호출 래퍼에 공통 예외 처리 계층 추가 (JSON 추출·저장).
-작업 중지를 위해 Genos Exception 을 통해서 에러 메세지 전달
테스트 시나리오
- 입력 텍스트 2만 토큰 이상 pdf → 400 반환 → 적재 상태에 원본 에러 메세지 exception 전달됨을 assert