Database

[데이터베이스 개론] Chapter1 - 데이터베이스 기본 개념

로승리 2023. 4. 17. 16:08

데이터와 정보

데이터는 현실 세계에서 관찰한 어떤 사실이나 값이며 정보는 이러한 데이터를 의미 있게 활용할 수 있도록 체계적으로 가공한 것이다. 데이터로부터 정보를 추출하는 과정이나 방법을 정보 처리라고 한다.

 

 

그렇다면 의미 있는 정보를 얻으려면 어떻게 해야 할까?

먼저 의미 있는 데이터를 많이 확보해야 하고 이러한 데이터를 필요할 때 언제든 다시 사용할 수 있게 저장해야 한다. 이러한 역할을 하는 것을 정보 시스템이라 하며 정보 시스템에서 핵심적인 요소가 데이터베이스이다.

 

 

데이터베이스의 정의와 특징

데이터베이스의 정의

  • 데이터베이스는 특정 조직의 여러 사용자가 공유하여 사용할 수 있도록 통합하여 데이터를 저장한 운영 데이터의 집합이다.
    • 공유 데이터 : 데이터베이스는 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있어야 하기 때문에 사용 목적이 다른 사용자를 모두 고려하여야 한다.
    • 통합 데이터 : 데이터베이스는 중복 데이터를 최소화하고 통제가 가능한 데이터의 중복만 허용해야 한다.
    • 저장 데이터 : 데이터베이스는 컴퓨터가 주로 처리함으로 컴퓨터가 접근할 수 있는 매체에 있어야 한다.
    • 운영 데이터 : 데이터베이스는 조직을 운영하고 주요 기능을 위해서 지속적으로 유지해야 한다.

데이터베이스 특징

  • 실시간 접근 : 사용자의 요구에 가장 빠르게 응답해야 한다. (몇 초 이내)
  • 계속 변화 : 데이터베이스는 지속적으로 데이터를 IDU 하여 현재의 정확한 데이터를 유지해야 한다.
  • 동시 공유 : 여러 사용자가 같은 데이터를 사용할 수 있습니다. 이러한 일을 가능하게 하기 위해 트랜잭션을 이용하여 일관성을 유지하고, 락 등의 기술을 이용한다.
  • 값으로 참조 : 찾고자 하는 데이터의 조건만으로 조건에 맞는 데이터를 모두 검색할 수 있다.

데이터 분류

형태에 따른 데이터의 분류

  • 정형 데이터 : 엑셀과 같이 미리 정해진 구조 (Schema)에 따라 저장된 데이터이며, 데이터 구조에 대한 설명과 데이터의 내용은 별도로 유지된다.
  • 반정형 데이터 : HTML, JSON과 같이 구조에 따라 저장된 데이터이지만 데이터 내용 안에 구조에 대한 설명이 함께 존재한다.
  • 비정형 데이터 : 소설 데이터의 텍스트나 영상 워드와 같이 정해진 구조가 없는 데이터이며, 최근 가장 증가하고 있는 데이터 타입이다.

특성에 따른 데이터의 분류

  • 범주형 데이터 : 종류를 나타내는 값을 가진 데이터를 의미한다.
    • 명목형 데이터 : MBTI 검사 결과와 같이 순서나 서열이 없는 값을 가지는 데이터를 의미한다.
    • 순서형 데이터 : 학년, 회원 등급과 같이 순서나 서열이 있는 값을 가지는 데이터를 의미한다.
  • 수치형 데이터 : 양적 측면에서 크기 비교와 산술적인 연산이 가능한 값을 가진 데이터를 의미한다.
    • 이산형 데이터 : 고객 수와 같이 개수를 셀 수 있지만 이어지지는 않는 숫자 값을 가지는 데이터를 의미한다.
    • 연속형 데이터 : 키, 몸무게와 같이 개수를 셀 수 있고 측정을 통해 얻어지는 숫자값을 가지는 데이터를 의미한다.

범주형 데이터의 대부분은 문자열로 크기 비교나 산술 연산이 불가능하기 때문에 질적 데이터라고도 한다.

의미 있는 데이터를 추출하기 위해서는 데이터의 특성에 맞게 저장 및 분석을 해야 한다.

 

출처 : 김연희, 데이터베이스 개론 3판, 한빛아카데미(2022)