1과목. 데이터 이해
01장. 데이터의 이해
(1) 데이터의 특성
구분 | 형태 | 예 |
존재적 특성 | 있는 그대로의 객관적 사실, fact | 수학 80점, 영어 100점 |
당위적 특성 | 추론 · 예측 · 전망 · 추정을 위한 근거, 가공된 자료 | 평균 90점 |
(2) 정형, 비정형, 반정형 데이터
구분 | 특징 | 예 |
정형 데이터 | 고정된 틀이 있고 연산이 가능한 데이터 | CSV, 엑셀 스프레드시트, 데이터프레임 등 |
비정형 데이터 | 고정된 틀이 없고 연산 불가능 | 워드 문서, 소셜 데이터, 댓글, 영상, 음성 등 |
반정형 데이터 | 고정된 형태는 있지만 연산 불가능 | XML, JSON, 센서 데이터 등 |
(3) 암묵지와 형식지의 상호작용
암묵지 | 형식지 |
공통화(Socialization) | 표출화(Externalization) |
내면화(Internalization) | 연결화(Combination) |
- 공통화
- 내면화
- 표출화: 개인이 보유한 경험을 타인이 쉽게 접근할 수 있도록 문서나 매체로 변환하는 과정/내재된 지식을 외부로 표출
- 연결화
(4) DIKW 피라미드
- 데이터: 객관적인 사실
- 정보: 데이터의 가공 · 처리와 데이터 간 연관 관계 속에서 의미가 도출된 것
- 지식: 데이터를 통해 도출된 유의미한 정보와 개인적인 경험을 결합하여 고유의 지식으로 내재화된 것
- 지혜: 지식의 축적과 아이디어가 결합된 창의적 산물
(5) 데이터베이스의 일반적인 특징(p12)
- 통합된 데이터: 동일한 내용의 데이터가 중복되어 있지 않음
- 저장된 데이터: 컴퓨터 매체가 접근할 수 있는 저장 매체에 저장되어 있음
- 공용 데이터: 여러 사용자가 공유할 수 있음
- 변화하는 데이터: 삽입, 수정, 삭제를 통해 항상 최신의 정확한 데이터를 유지해야 함
(6) 데이터베이스의 다양한 측면에서의 특성
- 정보의 축적 및 전달 측면(➪ tech): 기계 가독성/검색 가능성/ 원격 조작성
- 정보이용 측면(➪ user ): 요구에 따라 정보를 신속하게 획득할 수 있고 원하는 정보를 정확하고 경제적으로 찾아낼 수 있음
- 정보관리 측면(➪ DB ): 정보를 일정한 질서와 구조에 따라 정리 · 저장하고 검색 · 관리할 수 있게 하여 방대한 정보를 체계적으로 축적하고 새로운 내용 추가나 갱신이 용이함
- 정보기술발전 측면: 정보처리, 검색 · 관리 소프트웨어, 관련 하드웨어, 정보 전송을 위한 기술 발전을 견인할 수 있음
- 경제 · 산업적 측면: 필요에 따라 신속하게 제공 · 이용할 수 있는 인프라의 특성을 가지고 있어 경제, 산업, 사회 활동의 효율성르 제고하고 국민의 편의를 증진하는 수단으로써의 의미를 가짐
(7) 기업 내부의 데이터베이스
- OLTP(Online Transaction Progressing) 시스템: 정보 수집과 조직 내 공유를 위한 경영정보시스템과 자동화 기업 활동에서 영역별로 구축되던 자동화 중심의 시스템
- OLAP(Online Analytical Progressing) 시스템: 데이터 마이닝 등의 기술이 등장하며 수집과 공유가 아닌 분석이 중심이 되는 시스템 구축으로 변화함
(8) 데이터베이스의 종류
➊ RDB(관계형 데이터베이스)
- 행열로 이뤄진 테이블에 저장
- 하나의 열은 하나의 속성을 나타내고 같은 속성의 값만 가질 수 있음
- 정형 데이터를 다루는 데 특화
ex)
· Oracle, MySQL, MS-SQL, DB2 · Infomix, MariaDB, Derby, SQLite
➋ NoSQL
- Non SQL, Non-relational의 의미로 비관계을 의미함
- SQL이 필요없다는 의미가 아닌 기존 RDB의 SQL을 보완 및 개선한 비관계형 DB라는 의미
- 비정형 데이터와 대용량 데이터 분석 및 분산처리에 용이
ex)
· Document-Oriented DB: CouchDB, MongoDB, Elaticsearch, Cloudant
· Key-Value DB: Dyamo, Redis, Riak, Coherence, SimpleDB
· Column-Oriented DB: Bigtable, Cassandra, HBase, HyperTable
'🖊️Certificate > 📌ADsP' 카테고리의 다른 글
[ADsP] 2과목_01장. 데이터 분석 기획의 이해 (0) | 2024.02.19 |
---|---|
[ADsP] 1과목_02장. 데이터의 가치와 미래 (2) | 2024.02.14 |
[ADsP] Part3 오답 개념 정리 (0) | 2021.08.24 |
[ADsP] Part2 오답 개념 정리 (0) | 2021.08.16 |
[ADsP] Part1 오답 개념 정리 (0) | 2021.08.12 |
댓글