fit_predict

Fit_predict 명령어 문법 및 연동규격 설명입니다.

개요

이 명령어는 해당 데이터를 선택한 알고리즘으로 기계학습 모델에 TEST set을 넣은 값을 출력합니다.

설명

데이터를 학습하고 싶은 알고리즘(ex:classfication,regeression,clustering,ranking,…)을 선택하여 해당 알고리즘에 맞게 기계학습한 모델을 만들고 저장 여부를 선택합니다. 이 때, 해당 알고리즘 각각의 하이퍼파라미터를 조정하여 사용자가 원하는 모델의 결과 값을 확인할 수 있습니다.

Algorithms

각 알고리즘의 사용법은 관련 명령어 문서를 확인해주세요.

Examples

  • 검색대상이되는 데이터가 다음과 같이 존재합니다.

UPDATE_TIME

SYS_OUT

OUT_TYPE

LAT

LON

2018-03-08 1:00

a

37.5

127.5

107

2018-03-08 1:00

b

37

126.5

145

2018-03-08 1:00

c

38.5

126

797

2018-03-08 1:00

a

38

128

456

2018-03-08 1:00

d

36.5

127

41

2018-03-08 1:00

c

37

126

179

  • Fit_predict으로 logicsticregression을 적용해 TEST set을 출력하는 명령어 예제입니다.

    ... | fit_predcit logisr FEATURES LAT,LON LABEL SYS_OUT maxIter=100 regParem=0.01 (INTO modelA)
    

    명령어 이후 예측 값 출력

SYS_OUT

LAT

LON

(PROBABILTY)

PREDICTION

a

127.5

107

0.77231

a

b

126.5

145

0.67525

b

c

126

797

0.22345

c

a

128

456

0.22456

b

a

126

179

0.23098

b

c

127

41

0.45671

b

Parameters

fit_predictCommand : alg option

이름

설명

필수/옵션

alg

*학습 알고리즘입니다.
예 : LogisticRegression

필수

option

해당 알고리즘의 내부 파라미터 및 모델 저장 이름입니다.
예 : FEATURES fieldA, fieldB, LABEL target maxIter=100 regParam=0.1 fitIntercept=True INTO modelA

필수

*학습 알고리즘

알고리즘

지정파라미터

필수요소

LogisticRegression

Label, Features, regParam, maxIter, name

Label, Features, name

SVM

Label, Features, regType, maxIter, name

Label, Features, name

Decisontree

(Label), Features, maxDepth, name

(Label), Features, name

RandomForest

(Label), Features, numTree, name

(Label), Features, name

LinearRegression

Label, Features, regParam, name

Label, Features, name

Kmeans

Features, numk,name

Features,numk,name

FPGrowh

Features, minSupport, minConfidance, name

Features, name

Parameters BNF

fit_command : alg options
alg : WORD
options : any
        | options any
any : WORD
    | NUMBER
    | DOUBLE
    | EQUALS
    | COMMA
    | SPACE
    | DOT
    | TIMES
    | MINUS
    | LBRACKET
    | RBRACKET

WORD = r'\w+'
COMMA = r','
TIMES = r'\*'
MINUS = r'-'
EQUALS = r'\='
SPACE = r'\ '
DOT = r'\.'
LBRACKET = r'\['
RBRACKET = r'\]'
NUMBER = \d+
DOUBLE = [-+]?[0-9]+(\.([0-9]+)?([eE][-+]?[0-9]+)?|[eE][-+]?[0-9]+)