LLM 모델 학습

학습 LLM 생성

  • 학습 LLM 생성 버튼을 클릭하여 생성을 시작합니다.

  • 학습 LLM 생성시 필요한 정보를 입력합니다.

    • 제목 : 학습 목록에 보여질 제목입니다.

    • 상세설명 : 학습에 대한 메모를 남겨 놓을 수 있습니다.

    • 관리그룹 : 해당 학습 태스크를 관리 권한을 가지는 그룹명을 선택합니다.

    • 도커이미지 : 학습을 실행할 도커 이미지를 선택합니다.

    • 인스턴스타입 : 학습할때 필요한 인스턴스타입(CPU, 메모리)를 선택합니다.

    • 기반모델 : 파인튜닝할 기반 모델을 선택합니다.

    • 기반모델 리비전 : 파인튜닝할 기반모델의 리비전을 선택합니다.

  • 학습 종류를 선택합니다.

    • DPO : 강화학습 종류중 하나로 데이터셋은 질문, 좋은 답변, 나쁜 답변이 세트로 있어야 됩니다.

    • SFT : 지도학습으로서 데이터셋은 질문, 답변이 세트로 있어야 됩니다.

  • 하이퍼파라미터와 학습설정을 수정할수 있습니다.

  • GPU 할당량 및 할당량에서 사용할 GPU수량을 선택하고 생성 버튼을 클릭합니다.

    • GPU 할당량은 관리자에게 부여받은 할당량으로서 LLM 학습 생성 관리그룹이 사용할 수 있는 할당량 중 하나가 보이게 됩니다.

    • 학습을 시작하면 선택한 GPU 수량만큼 GPU 할당량에서 차감됩니다.

  • 학습이 완료 되면 선택한 학습 모델의 리비전 정보가 추가되고 학습한 모델이 저장됩니다.

LLM 학습 현황 확인

  • 학습 LLM 목록에서 생성한 항목을 더블 클릭합니다.

  • 기본정보 탭에서는 학습 시 셋팅한 설정들을 확인할 수 있습니다.

  • 이벤트 로그 탭에서는 현재 학습 중에 발생하는 이벤트를 확인할 수 있습니다.

  • 학습 로그 탭에서는 학습 이벤트에서 발생하는 로그를 확인할 수 있습니다.

  • 컨테이너 로그 탭에서는 학습 중인 컨테이너에서 발생하는 로그를 확인 할 수 있습니다.

  • 텐서보드 버튼을 누르면 학습 로그에 대해 차트로 확인을 할 수 있습니다.

Last updated

Was this helpful?