# 모델 서빙 스케일 아웃

### 서빙 스케일아웃

* 서빙 리비전 추가를 진행합니다.
* 서빙 리비전 추가 방법은 [LLM 모델 서빙 메뉴](https://github.com/genonai/genos-docs/blob/fix/v1.7.6-comment-fix-4/basic-tutorials/guides/llm/interactive-blocks.md)를 참고하세요.

<figure><img src="/files/t0mk1Aorft1dy6PHMiAk" alt=""><figcaption></figcaption></figure>

* 리비전 목록에 서빙된 리비전이 2개가 되도록 하였습니다.

<figure><img src="/files/EA2BYqIeGnxNp33QcM1w" alt=""><figcaption></figcaption></figure>

* 기본 정보 탭에서 수정 버튼을 클릭합니다.

<figure><img src="/files/JlR8wYGLbPX7d4NQiMr5" alt=""><figcaption></figcaption></figure>

* 대표리비전의 트래픽을 분배하여 저장 버튼을 누릅니다.
* 대표 리비전에 연결된 서빙 리비전의 트래픽 분배를 설정하였습니다. 이제 대표리비전으로 호출하는 요청은 비율에 맞게 분산 처리 됩니다.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://genos-docs.gitbook.io/default/v1.7.5.1/basic-tutorials/guides/llm/serving-scaleout.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
