# 데이터셋

데이터셋은 학습, 평가, 추론 등에 사용되는 데이터를 체계적으로 관리하는 기능입니다. 버전별로 데이터를 관리할 수 있으며, 팀원들과 공유하여 협업할 수 있습니다.

## 데이터셋 목록

<figure><img src="/files/nMzyMCtkeZ9FiA0B7M84" alt="데이터셋 목록"><figcaption><p>데이터셋 목록 화면</p></figcaption></figure>

* 데이터 > 데이터셋 메뉴에서 생성된 데이터셋 목록을 확인할 수 있습니다.
* 목록에서 ID, 제목, 상세 설명, 제작자, 등록일시 정보를 확인할 수 있습니다.

## 데이터셋 생성하기

### 데이터셋 생성 시작

<figure><img src="/files/YcICyioEyedE8LuQ1OM6" alt="데이터셋 생성 버튼"><figcaption><p>데이터셋 생성 버튼</p></figcaption></figure>

* **데이터셋 생성 버튼**을 클릭합니다.

### 기본 정보 입력

<figure><img src="/files/l0Nyc9qeTPVhDe2w5SVp" alt="데이터셋 기본 정보 입력"><figcaption><p>데이터셋 기본 정보 입력</p></figcaption></figure>

* 데이터셋 생성을 위한 기본 정보를 입력합니다.
  * **제목**: 데이터셋의 이름을 입력합니다.
  * **상세 설명**: 데이터셋의 목적이나 특징을 설명합니다.

### 데이터셋 유형 선택

<figure><img src="/files/GRhXEinE5GSzQ5Q0QZgx" alt="데이터셋 유형 선택"><figcaption><p>데이터셋 유형 선택</p></figcaption></figure>

* 데이터셋의 용도에 맞는 **유형**을 선택합니다.
* 선택 가능한 유형:
  * **학습용**: 모델 학습에 사용되는 데이터셋
  * **평가용**: 모델 평가에 사용되는 데이터셋

## 데이터셋 상세

<figure><img src="/files/EVopycSsfmSaACAFwsvv" alt="데이터셋 상세"><figcaption><p>데이터셋 상세 화면</p></figcaption></figure>

* 데이터셋 목록에서 항목을 더블 클릭하면 상세 페이지로 이동합니다.
* 상세 페이지에는 **기본 정보** 탭과 **리비전 목록** 탭이 있습니다.

## 데이터셋 리비전 추가하기

<figure><img src="/files/66eY3OwtH7nmdsuxaqpb" alt="데이터셋 리비전 추가"><figcaption><p>데이터셋 리비전 추가</p></figcaption></figure>

* 데이터셋 상세 페이지에서 **리비전 추가 버튼**을 클릭합니다.
* 리비전을 통해 데이터셋의 버전을 관리할 수 있습니다.
* 새로운 데이터를 추가하거나 기존 데이터를 수정할 때마다 리비전을 생성하여 이력을 관리합니다.

## 리비전 목록

<figure><img src="/files/SVr6D4qmhUvQ0EF0ucxn" alt="데이터셋 리비전 목록"><figcaption><p>데이터셋 리비전 목록</p></figcaption></figure>

* **리비전 목록** 탭에서 생성된 모든 리비전을 확인할 수 있습니다.
* 각 리비전의 ID, 행 수, 전체 용량, 한계 크기, 제작자, 등록일시를 확인할 수 있습니다.
* 리비전을 더블 클릭하면 상세 페이지로 이동합니다.

## 리비전 상세

<figure><img src="/files/LsC22yGyOZWlKIOur7mc" alt="데이터셋 리비전 상세"><figcaption><p>데이터셋 리비전 상세 화면</p></figcaption></figure>

* 리비전 상세 페이지에서 해당 버전의 데이터 내용을 확인할 수 있습니다.
* 데이터의 구조와 내용을 미리보기로 확인할 수 있습니다.
* 필요한 경우 데이터를 다운로드하거나 수정할 수 있습니다.

## 데이터셋 공유하기

<figure><img src="/files/sjH4DfqSgEG3H90GplL8" alt="데이터셋 공유"><figcaption><p>데이터셋 공유 설정</p></figcaption></figure>

* 데이터셋을 팀원들과 공유할 수 있습니다.
* **공유** 기능을 통해 다른 사용자에게 데이터셋 접근 권한을 부여할 수 있습니다.
* 공유 설정을 통해 협업 환경에서 데이터를 효율적으로 관리할 수 있습니다.

## 데이터셋 활용

생성된 데이터셋은 다음과 같은 용도로 활용할 수 있습니다:

* **모델 학습**: 학습용 데이터셋을 사용하여 AI 모델을 학습시킬 수 있습니다.
* **모델 평가**: 평가용 데이터셋으로 학습된 모델의 성능을 측정할 수 있습니다.

리비전 관리를 통해 데이터의 변경 이력을 추적하고, 필요한 경우 이전 버전으로 되돌릴 수 있습니다.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://genos-docs.gitbook.io/default/v1.8.4/basic-tutorials/guides/data/dataset.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
