일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 공정능력
- mybatis
- R
- GIT
- IntelliJ
- plugin
- Express
- react
- Kotlin
- xPlatform
- Eclipse
- mapreduce
- Python
- MSSQL
- SPC
- table
- SQL
- NPM
- hadoop
- JavaScript
- Android
- es6
- vaadin
- Spring
- 보조정렬
- window
- tomcat
- Sqoop
- Java
- SSL
- Today
- Total
목록전체 글 (656)
DBILITY
※R을 이용한 데이터 분석 실무를 참고하자. doBy 패키지는 summaryBy(), orderBy(), splitBy(), sampleBy()와 같이 데이터프레임에서 특정 값에 따라 데이터를 처리한다. summaryBy() 컬럼값에 따라 그룹핑 후 처리 sampleBy() 컬럼값에 따라 그룹핑 후 샘플 추출 orderBy() 컬럼값에 따라 정렬 패키지가 설치가 안된 경우 install.packages("doBy") 또는 Rstudio package패널에서 설치한다. formula(수식)은 + 는 연결, - 는 제외, 앞은 대상 ~ 기준 형태로 기준을 나타낸다. aggregate()함수는 일반적인 집계연산에 적용 가능하다. > install.packages("doBy") Installing package..
앞선 내용들에서 다루었지만, 정리를 해보자. c() : combine 값을 조합하여 벡터나 리스트에 할당 paste() : 문자열 합치기 concatenation str() : structure 데이터 구조 표시 class() : 데이터 타입 표시 is.na() : 데이터에 NA가 포함되어 있지는 표시 save() : 데이터 파일 저장 load() : 저장된 데이터 적재 rbind() : 행렬이나 데이터 프레임에 행단위 데이터 추가 cbind() : 행렬이나 데이터프레임에 열 단위 데이터 추가 as.character() : 문자열로 변경 unique() : 중복제거 summary() : 데이터에 대한 요약정보 quantile() : 분위수 seq() : 일련번호 생성 등등 많다. apply() 계열 함수..
csv부터 해봐야겠다.SPC시료를 csv로 다운로드할 수 있도록 구현되어 있으니까... 데이터 정제시 전처리과정이라고나 할까..읽어서 전처리할 것 다 하고 저장.. read.으로 시작하는 함수들이 있다.help에 read를 입력해 보니 csv, delim, table, table.url, socket도 있다. callback도 되나? 파일저정시 인코딩을 아래와 같이 하면 된다. 참고 Rstudio 에디터에서 한글이 입력되지 않을 수 있다. 이때는 작업표시줄을 한번 클릭하고 다시 해보면 된다. read.csv( file, header = FALSE, sep = "", quote = "\"'", dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"), ..
함수에 대한 기초 설명은 필요 없을 듯하다. 가변 인수(...)를 설정할 수 있다는 것과 중첩 함수를 실습해 보자. R에 내장된 datasets으로 실습해 볼 수 있다. > f f(1,2,3,4,5) [1] "hello 1" [1] "hello 2" [1] "hello 3" [1] "hello 4" [1] "hello 5" #중첩함수 = 함수내에 함수를 정의하는 것 #인터프리트방식의 실행이라 먼저 선언되어 있어야 한다. > f r r(5) [1] 9 #ls()함수는 선언된 변수의 목록을 출력한다. > ls() [1] "df" "f" "r" "x" #rm()함수는 선언된 변수를 모두 삭제한다. > rm(list=ls()) > ls() character(0) #함수 내부에서 변수의 참조는 동일레벨(?)순서다..
사칙연산 등 직접 해보면 된다. 기술통계의 기본 함수들을 시험했다. #나머지 mod > 7%%3 [1] 1 #몫 > 7%/%3 [1] 2 #나누기 > 7/3 [1] 2.333333 #자승 > 2^2 [1] 4 > 2^3 [1] 8 #제곱근 > sqrt(2) [1] 1.414214 > sqrt(2)^2 [1] 2 > x str(x) num [1:5] 1 2 3 4 5 > class(x) [1] "numeric" #합계 > sum(x) [1] 15 #최대값 > max(x) [1] 5 #최소값 > min(x) [1] 1 #평균값 > mean(x) [1] 3 #표본분산 > var(x) [1] 2.5 #표본표준편차 > sd(x) [1] 1.581139 #중위수 > median(x) [1] 3 > x x [1] 1..