Study. ADsP
Part3. 데이터 분석 [2장. R 프로그래밍 기초]
R 소개
[1] 데이터 분석 도구의 현황
(1) R의 탄생
- 오픈소스 프로그램
- 통계·데이터마이닝과 그래프를 위한 언어
- 다양한 최신 통계분석과 마이닝 기능 제공
(2) R의 특징
① 오픈소스 프로그램: 사용자 커뮤니티에 도움 요청이 쉬우며, 많은 패키지가 수시로 업데이트
② 그래픽 및 성능: 프로그래밍이나 그래픽 측면 등 대부분의 주요 특징들에서 상용 프로그램과 대등하거나 월등함
③ 시스템 데이터 저장 방식: 각 세션 사이마다 데이터셋을 저장함으로 매번 로딩할 필요없고 명령어 스토리도 저장 가능
④ 모든 운영체제: 윈도우, 맥, 리눅스 운영체제에서 사용 가능
⑤ 표준 플랫폼: S 통계 언어를 기반으로 구현되며, R/S플랫폼은 사실상 표준 플랫폼
⑥ 객체지향 언어이며 함수형 언어: 통계 기능뿐만 아니라 일반 프로그래밍 언어처럼 자동화나 새로운 함수 생성 가능
가) 객체지향 언어의 특징
- SAS, SPSS에서 회귀분석 시, 화면에 결과가 산더미로 나오게 된다. 분석 결과를 활용하기 위해서는 추가로 프로그래밍을 하거나 별도의 작업이 필요
- 추정계수, 표준오차, 잔차 등 결과값을 객체에 저장하고 필요한 부분을 호출하여 쉽게 활용 가능
나) 함수형 언어의 특징
- 더욱 깔끔하고 단축된 코드
- 매우 빠른 코드 수행 속도
- 단순한 코드로 디버깅 노력 감소
- 병렬 프로그래밍으로의 전환이 더욱 용이
(3) R 스튜디오
- 래틀(Rattle): GUI가 패키지와 긴밀하게 결합돼 있어 정해진 기능만 사용 가능 → 업그레이드가 제대로 되지 않으면 통합성 문제 발생
R 기초(1)
[1] 통계 패키지 R
(1) 패키지(Package)
: R 함수와 데이터 및 컴파일된 코드의 모임
[2] 변수와 벡터 생성
(1) R 데이터 유형과 객체
유형 | 모드 |
숫자(Number) | integer, double |
논리값(Logical) | True(T), False(F) |
문자(Character) | "a", "abc" |
R 기초(2)
[1] R의 완전 기초
기능 | R 코드 |
출력하기 | - print(): 출력 형식을 지정할 필요가 없고 한번에 하나의 객체만 출력 - cat(): 여러 항목을 묶어서 연결된 결과로 출력하고 행렬, list 등의 복합적 데이터 구조 출력 불가능 |
변수에 값 할당하기(대입 연산자) | <-, <<-, =, -> |
변수 목록보기 | ls(), ls.str() |
변수 삭제하기 | rm() |
벡터 생성하기 | c() |
R 함수 정의하기 | function(매개변수1, 매개변수2,,,,,,매개변수n){지역변수1, 지역변수2,,,,,,,지역변수m} |
'🖊️Certificate > 📌ADsP' 카테고리의 다른 글
[ADsP] 2과목_01장. 데이터 분석 기획의 이해 (0) | 2024.02.19 |
---|---|
[ADsP] 1과목_02장. 데이터의 가치와 미래 (2) | 2024.02.14 |
[ADsP] 1과목_01장. 데이터의 이해 (0) | 2024.02.14 |
[ADsP] Part2 오답 개념 정리 (0) | 2021.08.16 |
[ADsP] Part1 오답 개념 정리 (0) | 2021.08.12 |
댓글