Search
📦

ADsP 키워드 중심으로 내용 총정리

다음은 책 2024 ADsP 데이터분석 준전문가를 공부하고 쓴 글입니다.

01. 데이터의 이해

01-1. 데이터와 정보

1.
데이터
가공되지 않은, 객관적인 사실 e.g. A는 100원, B는 200원에 연필을 판매했다.
2.
정보
가공된. 의미가 도출된. e.g. A 연필이 더 저렴하다. = 의미만 도출된 상태.
3.
지식
고유의 지식으로 내재화. e.g. 더 저렴한 A로부터 연필을 사겠다.
4.
지혜
아이디어가 결합된. 창의적. e.g. A의 다른 물건도 저렴할 것이다.
5.
존재적 특성
있는 그대로의 사실. 정보가 존재적 특성에 해당됨.
6.
당위적 특성
마땅히 그렇게 해야하는 것. 여기서는 추론, 예측, 전망, 추정을 마땅히 그렇게 해야한다고 보는 것이다. 정보가 당위적 특성에 해당한다.
7.
정성적 데이터
한자로 의미를 봤을 때, (정하다, 성질/본질/속성) 이다. 성질/본질/속성은 숫자로 정해질 수 없고, 언어와 서술적 표현으로 정해진다. 대표적인 형태 예시가 언어, 문자이다.
8.
정량적 데이터
한자로 의미를 봤을 때, (정하다, 수량/크기/정도) 이다.
9.
정형 데이터
형태가 정해진 데이터. 연산 가능. 데이터 수집 관리 용이. DB.
10.
비정형 데이터
형태가 정해지지 않은 데이터. 연산 불가능. 데이터 수집 관리 어려움. NoSQL DB.
11.
반정형 데이터
한자로 의미를 봤을 때, (절반/부분적으로, 정형) 형태가 정해진 데이터. 그러나 연산이 불가능. 데이터 수집 관리가 쉽지 않음. 예를 들어 JSON 이 반정형 데이터에 해당된다. 반정형 데이터는 가공을 통해 정형 데이터로 바꿀 수 있다.
12.
암묵지
겉으로 드러나지 않은 지식.
13.
형식지
겉으로 드러난 지식. 여러 사람이 공유할 수 있는 지식. 예를 들어, 교과서, 비디오 등이다.
14.
공통화
내면화된 지식 → 조직의 지식
15.
표출화
개인의 암묵지 → 책이나 교본 등으로 표출한 것.
16.
연결화
책이나 교분 등 표출화 된 것에 자신이 알고 있는 새로운 지식(형식지) 추가.
17.
내면화
형식지를 보고 다른 사람들이 암묵적 지식을 습득하는 것.
18.
bit, byte, KB, MB, GB, TB, PB, EB, ZB, YB
데이터 단위.