Command References

Command

Description

Category

adv

테이블의 각종 통계 정보를 구하거나 pivoting 할 수 있습니다. 고급시각화 화면에 사용되는 명령어 모음입니다.

anomalies

주어진 input 데이터에서 일반적인 범위를 벗어난 비정상적인 값을 찾아내는 기능입니다.

bimatrix

bimatrix에 쓰기를 하는 명령어 입니다.

calculate

행 or 열 간의 간단한 수식 계산을 합니다.

concat

선택한 컬럼을 concatenation 하는 명령어 입니다.

count

입력의 래코드 건수를 계산합니다.

distinct

선택한 컬럼에 대한 중복값 없는 데이터를 반환합니다.

eval

학습된 모델을 이용해 예측 결과를 반환하는 명령어 입니다.

fields

검색 결과가 출력 될 field를 설정합니다.

fillna

이 명령어는 특정한 필드의 결측치 처리에 사용합니다.

fit

이 명령어는 해당 데이터를 선택한 알고리즘으로 기계학습 모델을 만들어줍니다.

fit_predict

이 명령어는 해당 데이터를 선택한 알고리즘으로 기계학습 모델에 TEST set을 넣은 값을 출력합니다.

forecasts

주어진 데이터의 미래 시점 데이터를 예측합니다.

geoip

이 명령어는 ip가 포함된 필드를 기반으로 위, 경도 등의 추가정보를 제공합니다.

geomap

이 명령어는 업로드 되어있는 컬렉션을 기반으로 사용자가 요청하는 테이블에 지역 경계(geometry) 정보를 제공합니다.

geostats

이 명령어는 위, 경도 데이터를 포함한 두 개의 필드를 기반으로 그룹(지정 지역 클러스터)별 통계정보를 제공합니다.

hdfs

HDFS에 읽기 및 쓰기를 하는 명령어 입니다.

head

상위 records를 원하는 갯수 만큼 검색 결과에 출력 합니다.

img2tsv

이미지 파일을 읽어서 TSV 포멧으로 변환 저장하는 명령어 입니다.

indexer

설정한 컬럼의 데이터를 기반으로 indexing하는 명령어 입니다. 컬럼의 데이터가 다를 경우 같은 값이라도 index 결과가 다를 수 있습니다.

iris

IRIS에 읽기를 하는 명령어 입니다.

join

이 명령어는 다른 데이터 모델과 join을 할 때 사용됩니다.

kmeans

kmeans를 진행하는 명령어 입니다.

metatron

metatron에 쓰기를 하는 명령어 입니다.

mlmodel

Data-Discovery-Service ML 관련 명령어 이며, ML 명령어 중 fit 명령어를 통해 생성되는 모델 및 메타데이터를 관리하는 명령어 입니다.

model

모델에 해당하는 데이터 소스의 데이터를 로드합니다.

model-stats

지정된 필드에 대한 distinct count 값을 제공합니다.

model-statsdetails

지정된 필드에 존재하는 값들의 상위 빈도 10개 값을 제공합니다.

model-timeline

지정된 데이터 모델의 Timeline을 생성합니다.

modeldata

이 명령어는 Data-Discovery-Service ML 관련 명령어 이며, 사용자가 입력한 한 데이터를 데이터 프레임으로 반환 합니다.

outlier

여러 그룹을 대상으로 outlier 에 해당하는 그룹을 찾는 명령어 입니다.

pivot

테이블을 여러 컬럼들을 축으로 회전 및 각종 통계 정보를 행과 열 별로 구할 수 있습니다.

postagger

입력된 컬럼의 문장들을 단어로 쪼개고, 품사를 표기하는 명령어 입니다.

predict

이 명령어는 Data-Discovery-Service ML 관련 명령어 이며, 사전에 학습되어 있는 ML 모델을 불러와 넘겨받은 데이터에 적용하는 명령어 입니다.

pylambda

해당 명령어는 Python의 lambda 함수를 실행 합니다.

rename

이 명령어는 특정한 field를 다른 명칭으로 이름을 바꾸고자 할 때 사용됩니다.

round

이 명령어는 지정된 실수형 필드의 소수점을 반올림 하는 명령어 입니다.

sampling

이 명령어는 Data-Discovery-Service ML 관련 명령어 이며, 사용자가 입력한 수 만큼의 데이터를 반환합니다.

scaler

scaling을 진행하는 명령어 입니다.

search

이 명령어는 전문 검색(full-text search)을 하는데 사용 됩니다.

serving

Tensorflow Serving을 통해 예측, 모델의 서빙 상태를 확인하는 명령어입니다.

sort

이 명령어는 검색 결과를 지정된 필드를 기준으로 정렬합니다.

split

선택한 컬럼을 구분자를 통해서 분리하여 새로운 레코드로 만드는 명령어

splitter

레코드형 파일(들)을 train/test 로 분리 저장하는 명령어 입니다.

sql

SQL 형태의 질의를 합니다.

stats

각종 통계 데이터를 구하는 명령어 입니다.

substr

이 명령어는 특정한 필드나 문자열을 SUBSTRING 하고자 할 때 사용됩니다.

timeline

시간 범위에 따라 group by된 카운트의 숫자를 출력 합니다.

tokenizer

지정한 필드에 대해 tokenizer를 진행하는 명령어 입니다.

top

이 명령어는 검색 결과를 지정된 필드를 기준으로 정렬 후 상위 값을 출력합니다.

union

이 명령어는 다른 데이터 모델과 union 을 할 때 사용됩니다.

weekend

이 명령어는 주말/주중 데이터를 필터링하는데 사용합니다.

where

데이터를 일정 조건에 따라 filter 합니다.

ysort

이 명령어는 검색 결과로 생성된 필드의 순서를 지정된 기준으로 정렬합니다.

corr

이 명령어는 인수로 받은 필드와의 상관계수를 구합니다.