# 전처리기 관리

## 전처리기 관리

이 화면에서는 **전처리기(Preprocessor)** 를 등록하고 관리할 수 있습니다. 전처리기는 원본 데이터를 AI 모델의 **학습 및 추론에 적합한 형태로 변환**하는 역할을 하며, 데이터 품질과 AI 성능에 직접적인 영향을 미칩니다.

본 메뉴를 통해 전처리 스크립트를 체계적으로 관리함으로써 비정형 데이터의 **일관성·신뢰성**을 확보하고, AI 모델이 안정적으로 동작하도록 지원합니다.

> 전처리기 내부 구현 로직(일명 *facade code*)에 대한 설명은 [**전처리 facade 코드**](/default/v1.7.5/admin-management/settings/resource/basic_preprocessor_for_rag/intro.md) 문서를 참고하시기 바랍니다.

## 전처리기 관리

* 여기서는 전처리기 관리 화면에 대해서 다룹니다.
* 전처리기 내부 코드(일명 facade code)에 대해서는 전처리 [facade 코드](/default/v1.7.5/admin-management/settings/resource/basic_preprocessor_for_rag/intro.md) 설명란으로 이동하세요.

**전처리기 관리**

* **개념:** 데이터를 AI 모델 학습이나 추론에 적합한 형태로 변환하는 전처리 스크립트를 등록 및 관리하는 기능을 제공합니다. 데이터의 신뢰성을 확보하고 AI 모델이 최상의 성능을 발휘할 수 있도록 하기 위해 필수적인 기능입니다.
* **속성:**
  * **ID:** 전처리기의 고유 식별자. 시스템 내에서 전처리기를 구분하는데 사용됩니다.
  * **제목:** 전처리기의 제목. 예를 들어 “기본 전처리기”
  * **상세설명:** 전처리기에 대한 상세 설명. 예를 들어 “md, txt, json 등의 기본 파일”
  * **확장자:** 해당 전처리기의 파일 형식을 나타냅니다. 예를 들어 “json, html”
  * **제작자:** 전처리기를 생성한 제작자. 생성한 관리자 계정 정보를 나타냅니다.
  * **관리 그룹:** 전처리기를 관리할 수 있는 그룹을 나타냅니다.
  * **등록일시:** 전처리기의 등록일시. 전처리기가 시스템에 등록된 날짜와 시간을 나타냅니다.
* **전처리기 목록 화면 설명:**
  * **전처리기 타입 목록:** 시스템에 생성된 모든 전처리기 목록이 표시됩니다. 각 전처리기는 제목, 상세설명, 확장자, 코드, 파라미터, 제작자, 관리그룹, 등록일시 정보를 포함합니다.
  * **전처리기 검색:** 전처리기를 빠르게 찾기 위해 검색 기능을 사용할 수 있습니다.
  * **전처리기 생성:** 새로운 전처리기를 생성할 수 있는 버튼이 제공됩니다.

<figure><img src="/files/r71tuf995e2yxYX9TQ6T" alt=""><figcaption></figcaption></figure>

* **전처리기 생성 화면 설명:**
  * **제목:** 전처리기의 제목을 설정합니다. 예를 들어 “기본 전처리기”
  * **상세 설명:** 전처리기에 대한 상세 설명을 작성할 수 있습니다. 예를 들어 “md, txt, json 등의 기본 파일”
  * **관리 그룹:** 전처러기를 관리할 특정 그룹을 선택 가능합니다.
  * **확장자:** 전처리기가 적용될 파일의 형식을 지정합니다. 예를 들어 “json, html”
  * **코드:** 전처리 과정에서 실행될 코드(스크립트)를 작성하는 항목입니다.
  * **파라미터:** 전처리기 실행 시 사용할 입력 변수(매개변수)를 설정하는 항목입니다. 예를 들어 “{"chunk\_size":1000,"chunk\_overlap":100}”

<figure><img src="/files/n4ypWK1HEf50O4LUVMBJ" alt=""><figcaption></figcaption></figure>

* **전처리기 상세 화면 > 기본정보 설명:** **수정 불가능한 항목**

  * **제작자:** 전처리기를 생성한 관리자 계정정보가 표시됩니다. 예를 들어 “관리자 administrator”
  * **관리그룹:** 전처리기를 관리할 수 있는 그룹이 표시됩니다. 예를 들어 “공용 관리 그룹”
  * **등록일시:** 전처리기가 생성된 날짜와 시간이 표시됩니다. 예를 들어 “2024-12-30 10:38:02”

  **수정 가능한 항목 :** 수정 버튼 시 아래 입력칸이 활성화되며, 내용 수정 후에 저장 버튼 선택 시 수정 내용이 저장됩니다.

  * **확장자:** 생성 시 작성한 확장자가 나타납니다. 예를 들어 “hwp, pdf, md, txt, json”
  * **코드:** 생성 시 작성한 코드가 나타납니다. 예를 들어 “import subprocess …"
  * **제목:** 생성 시 작성한 제목이 나타납니다. 예를 들어 “기본 전처리기”
  * **상세설명:** 생성 시 작성한 상세설명이 나타납니다. 에를 들어 “md, txt, json 등의 기본 파일 외 pdf, hwp 까지 처리 가능한 전처리기.”

<figure><img src="/files/n4ypWK1HEf50O4LUVMBJ" alt=""><figcaption></figcaption></figure>

* **전처리기 상세 화면 > 배포이력 설명:**
  * **ID:** 배포이력의 고유 식별자. 배포된 각 전처리기마다 고유한 ID가 부여됩니다. 예를 들어 “9”
  * **인스턴스 타입:** 전처리기가 배포된 인스턴스의 타입. 마우스 오버 시, cpu와 메모리 정보도 나타납니다. 예를 들어 “mlarge”
  * **도커 이미지:** 전처리기를 실행하는데 사용된 도커 이미지. 예를 들어 “mnc/template-preprocessor:latest”
  * **복제본:** 전처리기가 실행된 인스턴스의 개수. AI 모델 학습 및 서빙 중 부하 분산을 위해 여러 개의 인스턴스를 배포할 수 있습니다.
  * **배포자:** 전처리기를 배포한 관리자 계정 정보가 표시됩니다. 예를 들어 “관리자 administrator”
  * **배포일시:** 전처리기가 시스템에 배포된 날짜 및 시간. 예를 들어 “2024-12-30 10:38:31”
  * **중지자:** 전처리기를 중지한 관리자 계정 정보가 나타납니다. 예를 들어 “관리자 administrator”
  * **중지일시:** 전처리기가 중지된 날짜 및 시간이 나타납니다. 예를 들어 “2025-01-14 12:07:54”

<figure><img src="/files/A85FLl7y6ydKDkXmG0kN" alt=""><figcaption></figcaption></figure>

* **이 페이지에서 가능한 주요 작업:**
  * **전처리기 생성:** 새로운 전처리기를 생성하고 코드 및 파라미터를 설정할 수 있습니다. 예를 들어 “기본 전처리기”
  * **전처리기 삭제:** 체크박스로 전처리기를 선택하여 삭제할 수 있습니다.
  * **전처리기 배포 및 배포중지:** 생성한 전처리기를 실행 환경에 배포하거나, 배포된 전처리기의 실행을 중지할 수 있습니다.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://genos-docs.gitbook.io/default/v1.7.5/admin-management/settings/resource/preprocessor.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
