본문 바로가기

Data Analysis '◡'✿/삼성SDS Brightics AI & Studio

[Brightics AI] Brightics Studio 사용법 : 기초편 (3) 기본 시나리오 실습

 

 

 

 

 

안녕하세요, Soa입니다!

😊

 

 

 

저번 포스팅에서는

차트 기능과 셋팅 방법에 대해서 알아보고

간단하게 실습을 진행했습니다!

 

 

[Brightics AI] Brightics Studio 사용법 : 기초편 (2) Chart 실습

안녕하세요, Soa입니다! 😊 저번 포스팅에서는 오픈소스 데이터 분석 AI 플랫폼인 Brightics Studio의 간단 사용법에 대해서 알아보고, 모델링 실습을 진행했습니다! [Brightics AI] Brightics Studio 사용법 :.

soa-park.tistory.com

 

 

 

 

Brightics Studio의 기본적인 사용 방법과

간단한 기능들에 대해서 알아보았으니

 

 

이번에는 기본 시나리오,

그러니까 기본적인 데이터 분석 과정을

실습해보는 시간을 가져보려고 합니다.

 

 


 

 

■ Brightics 사용법과 Basic Scenario

 

 

 

[Basic Scenario]

1. Data 입력 및 출력

2. 그래프 작성

3. Load & Statistic Summary

4. 필터(Filter) 함수 사용

5. Data 저장

6. 모델 저장 및 복사

 

 

 

위와 같은 기본 시나리오를 통해서

Brightics 사용법을 알아보고 실습을 통해 익혀보도록 하겠습니다!

 

 

이번 실습에서 사용하게 될 데이터는 'Sample_iris' 입니다.

 

이 데이터는 세 가지의 품종 별로 50개의 데이터,

총 150개의 데이터를 보유하고 있습니다.

 

 

 

 


 

[ 시나리오 (1) Data 입력 및 출력 ]

 

"데이터를 입력하고 출력하는 과정"

 

 

Brightics에서는 Repository에 데이터를 저장합니다.

 

컴퓨터에 데이터를 내려받기도 하고,

컴퓨터에 있는 데이터를 Repository에 업로드할 수 있습니다.

 

 

먼저 글로 살펴볼까요?

 

 

 

 

1) 데이터 다운로드

 

 

2) 데이터 업로드

 

 

 

데이터를 다운로드하는 과정은 비교적 간단하지만

업로드하는 과정은 상대적으로 복잡한 편입니다.

 

참고로 데이터 포맷을 지정할 때는

숫자는 Double로, 숫자가 아닌 경우에는 String으로 저장하는 것을 추천합니다!

 

 

 

 

실습을 통해서 자세히 알아볼까요?

 

 

 

 

[1] 데이터 다운로드 실습

 

 

 

기본적인 시나리오를 진행하기 위해

새로운 모델을 만들었습니다.

 

 

 

 

해당 모델을 Open 해주시고, 오른쪽 상단에 있는 'Palette'를 눌러주세요!

 

Data 탭에서 사용하고자 하는 데이터인 'sample_iris'를 검색해서 클릭한 후,

'+Add' 버튼 옆에 있는 점 세 개가 세로로 정렬된 버튼을 눌러주세요!

 

 

 

 

 

그럼 이렇게 Data Export라는 창이 떠오르고,

여기서 Delimeters는 Comma로 설정해준 후 Finish를 클릭하면

 

 

 

 

이렇게 Data가 다운로드된 것을 확인할 수 있답니다~

 

 

 

[2] 데이터 업로드

 

이번에는 데이터를 업로드하는 과정을 실습해볼까요?

 

다시 한번 Palette 창으로 되돌아가 주세요~

이번에는 Data 탭에서 '+ Add' 버튼을 눌러야 해요!

 

 

 

 

그럼 이렇게 Add Data 창이 떠오르고,

데이터 업로드 과정 중 첫번째데이터 선택(Select Data)입니다.

Local PC에서 데이터를 가져와야 하니 Local을 눌러주셔야 합니다.

 

 

 

 

 

클릭해서 나온 창에서 업로드하고 싶은 데이터를 찾아주세요~

저는 업로드 과정을 실습하는 것이기 때문에

아까 다운로드 받았던 데이터를 열었어요!

 

 

 

 

 

무사히 업로드가 완료되면 다음과 같은 창에서 데이터 미리보기 또한 가능하답니다!

그럼 다음 단계로 넘어가기 위해 Next를 눌러주세요~

 

 

 

 

두번째 과정에서는 Delimeter 선택(Select Delimeter)을 해야합니다.

Delimeter를 Comma로 설정하니 이렇게 Column들이 설정되는군요!

 

동일하게 Next를 눌러 다음 과정으로 넘어가볼게요~

 

 

 

마지막 과정은 Column Data Format 설정(Column Data Format Set)입니다.

 

 

각 변수에 대한 이름도 있지만

Type을 살펴보면 아까 설명했던 것처럼 숫자는 Double,

그 외에는 String으로 설정된 것을 볼 수 있습니다.

 

 

확인했다면 Finish를 눌러주세요~

무사히 업로드가 완료되면 upload 폴더에 파일이 업로드된 것을 확인할 수 있습니다!

 

 

 

 

 


[ 시나리오 (2) 그래프 작성 ]

 

 

이번에는 데이터를 업로드 한 뒤에,

그 데이터로 그래프를 작성하는 과정을 실습해보겠습니다.

 

이제는 너무나도 익숙한 Load 함수에서

path를 sample_iris.csv로 설정한 뒤, Run을 해주세요!

 

 

 

그럼 이렇게 데이터가 업로드된 것을 확인할 수 있죠?

 

여기서 저번 시간에 배웠던 차트 셋팅을 통해서 그래프를 그려보겠습니다!

 

 

 

 

저번 시간에 활용했던 Scatter Plot으로 설정하면 위와 같이 그래프가 작성되며,

다양한 그래프를 그리고, 내가 원하는 정보가 보고 싶을 경우 등에는

저번 시간에 배웠던 차트 셋팅 과정을 참고해주세요~

 

 

[Brightics AI] Brightics Studio 사용법 : 기초편 (2) Chart 실습

안녕하세요, Soa입니다! 😊 저번 포스팅에서는 오픈소스 데이터 분석 AI 플랫폼인 Brightics Studio의 간단 사용법에 대해서 알아보고, 모델링 실습을 진행했습니다! [Brightics AI] Brightics Studio 사용법 :.

soa-park.tistory.com

 

 

 

데이터 분석을 통해 나온 그래프를 분석해서

데이터 간의 관계를 분석하기도 하니

그래프를 작성하는 방법 또한 중요하겠죠?!

 

 

 

 

 

 


 

[ 시나리오 (3) Load & Statistic Summary ]

 

 

Load 함수 사용을 아직 모르시겠다면, 이전 게시글을 참고해주시면 될 것 같습니다!

 

Statistic 함수의 기본적인 사용법 또한 함께 참고해주시되,

이번 시나리오에서는 저번 실습과 동일하게 평균과 분산을 구해보겠습니다.

 

 

 

 

Statistic 함수를 추가하고 연결해준 다음에,

입력할 데이터와 타겟을 선택하면 오른쪽에 해당 데이터가 출력됩니다.

 

 

 

 

 

근데 출력 결과의 소수점을 제한하는 방법은 없냐고요?

 

물론 있습니다!

Chart Setting을 이용하면 가능하다구욧!

 

 

 

Chart Settings에서 Formatter를 클릭한 뒤,

'+' 버튼을 눌러 원하는 변수에 대해 어느 소수점까지 표현할 것인지

숫자까지 선택해주고 나면 데이터가 변화한 것을 확인할 수 있습니다!

 

참고로 Group By를 통해 데이터를 구분할 수 있습니다.

 

 

 


[ 시나리오 (4) 필터(Filter) 함수 사용 ]

 

 

필터 함수를 통해서 조건을 설정하고,

함수의 이름대로 조건에 따라 추출해내는 작업을 진행하겠습니다!

 

 

이번에는 Load 함수 옆에 Filter라는 함수를 배치해보겠습니다.

Load 함수 배치 방법과 동일하게 배치해주시면 됩니다.

 

 

 

 

그럼 이렇게 왼쪽에는 Load 함수에 설정된 Data가,

중간에는 Filter 함수와 관련된 설정창이 나타납니다.

 

중간에 있는 Condition을 눌러서 조건을 설정하겠습니다.

 

 

 

먼저 Select Column으로 조건과 관련된 변수를 설정해주세요!

 

 

 

 

그 다음 조건을 설정해주겠습니다.

 

코딩을 배웠던 분들이라면 많이 알 법한 기호가 등장했습니다...!

코딩을 할 때, 같다라는 의미는 '=='인 것 다들 알고 계시죠?!

 

조건을 설정해 준 뒤에는 변수가 어떤 값일지를 선택하면 됩니다.

 

 

 

이렇게 조건문을 설정한 뒤에 Ok를 클릭해주세요~

결과를 확인하기 위해서는 Run 버튼까지 눌러야해요!

 

 

 

 

그럼 이렇게 조건에 맞는 데이터만 존재하는 것을 볼 수 있습니다!

 

 

 

어라? 별 차이 없는 것 같은데요?!

 

아뇨!!

잘 보면 왼쪽과 오른쪽의 스크롤바 길이가 다르죠?

데이터가 필터링을 거쳐서 조건에 맞는 데이터만 남아있는 것을 볼 수 있어요~

 

 

 

 


[ 시나리오 (5) Data 저장 ]

 

 

그럼 필터를 거친 데이터를 저장해볼까요?

 

두 가지 정도의 방법이 존재합니다!

 

 

 

[1] Download to PC 방법

 

첫번째로 방금 전 작업을 마친 데이터를 바로 저장하겠습니다!

 

 

 

데이터 테이블 위에 가장 왼쪽에 있는 Download 버튼을 누르면

 

 

 

이렇게 데이터를 다운로드하는 것이 가능합니다!

여기서 데이터를 선택하고, DelimeterFile Name 또한 설정 가능합니다~

 

 

 

 

굳이 설정하지 않아도 이렇게 자동으로 파일명을 생성해주기도 합니다!

 

 

 

[2] Unload 함수 이용 방법

 

두 번째 방법으로는 Unload 함수를 이용해서 저장하는 방법입니다.

 

 

 

Unload 함수를 생성해주면 이렇게 함수창이 생성되는데,

오른쪽에 Input은 Filter를 거친 데이터 테이블인 것을 확인할 수 있습니다.

(위에서 iris 데이터가 Filter를 거치는 과정을 진행했으니 당연한 결과죠?)

 

 

 

그럼 이 데이터를 어디에 저장할 것인지 결정하기 위해서 Path를 설정해줍시다!

 

 

내가 저장하고 싶은 위치를 누르고 (데이터를 선택하면 안돼요!)

Path에서 해당 데이터 이름을 임의로 설정해주세요~

파일 확장자명까지 입력 필수!

 

Run 버튼까지 눌러주면 해당 경로에서

저장한 데이터를 확인할 수 있습니다!

 

 

 


[ 시나리오 (6) 모델 복사 및 저장 ]

 

 

지금까지 실습했던 모델을 복사하고 저장하는 과정을 실습해보겠습니다.

 

 

 

[1] Mode 복사

 

 

지금까지 했던 모델을 복사하기 위해서는 왼쪽 상단에 'Brightics Studio'를 눌러

홈 화면인 프로젝트 view로 이동하시면 됩니다.

 

 

 

이렇게 홈화면에서 내가 지금까지 수정하던 모델이 있는 것을 확인할 수 있습니다.

(저장 및 수정 시간 또한 확인 가능)

 

복사하고 싶은 모델의 오른쪽 상단에 있는 점을 클릭하면

위와 같은 창이 떠오르고, 복사하기 위해 'Duplicate'를 클릭해주세요!

 

 

 

 

 

그럼 이렇게 Duplicate Model 창이 생성되고,

여기서 복사한 모델의 이름을 설정하고 어떤 프로젝트로 보낼지 설정할 수 있습니다.

 

OK를 누르면, 방금 전의 Project view에서 복사한 모델을 확인 가능합니다.

 

 

 

 

 

[2] 모델 저장

 

 

이번에는 Copy한 모델을 저장해보겠습니다.

 

 

 

이번에는 저장하고 싶은 모델을 선택하고, 'Export' 버튼을 눌러주세요!

 

 

 

 

그럼 이렇게 Export 작업 확인 창이 떠오르는데,

여기서 관련된 파일들을 모두 가져갈 것이냐고 물어봅니다.

필요 여부에 따라서 옵션을 선택하면 되겠죠?

 

 

 

 

OK를 누르면 이렇게 json 파일로 저장된 것을 확인할 수 있어요!

 

 

 

 

 

그럼 이렇게 저장한 모델을 나중에 다시 불러오고 싶다면?

 

 

 

Import를 누르고, 팝업창에서 Select File을 통해

PC 저장된 파일을 선택하면 업로드되며,

OK 버튼을 누르면 최종적으로 모델이 Import 됩니다.

 

 

복사되고 import된 모델은 꼭 Run 작업을 진행해줘야만

함수창에서 데이터를 확인할 수 있으니 잊지 마세요~!

 

 

 

 

 


 

 

 

끄읏-!

 

 

이번 포스팅에서는 기본 시나리오를 통해서

이전에 설명했던 사용 방법을 리뷰하는 실습을 진행했습니다.

 

어떤 플로우를 통해서 데이터를 분석하는지 대충 감이 오시나요~?

 

 

 

저는 아직 모르겠어요 ٩( ᐛ )و

 

 

Brightics를 완전하게 뽀개기 위해서

다음 포스팅에서는 종합 시나리오를 실습해보겠습니다..! (두근두근)

 

 

 

 

포스팅에서 오류나 오타를 발견하셨다면

댓글로 피드백을 남겨주세요~ :)

 

 

 

그럼 다음 포스팅에서 만나요~

٩( ᐛ )و

 

 

 

 

 

 

 

 

 

* Brightics 서포터즈 활동의 일환으로 작성된 포스팅입니다. *

반응형