Database

[데이터베이스 개론] Chapter3 - 데이터베이스 시스템

로승리 2023. 4. 17. 19:15

 

데이터베이스 시스템의 정의

데이터베이스 시스템이란 데이터베이스에 데이터를 저장하고, 저장된 데이를 관리하여 필요한 정보를 생성해 주는 시스템이다. 

  • 데이터베이스  : 데이터를 저장하는곳, 저장된 데이터의 집합
  • 데이터베이스 관리 시스템 : 데이터베이스에 저장된 데이터의 일관적이고 무결한 상태로 유지하되도록 관리하는 것
  • 데이터베이스 시스템 : 데이터베이스와 데이터베이스 관리 시스템을 이용해 필요한 정보를 제공하는 것
  • 추가적으로 데이터베이스 시스템은 데이터 언어, 데이터베이스와 DBMS 설치, 데이터 처리 연산을 담당한다.

 

데이터베이스의 구조

  • 스키마(schema)
    • 스키마는 데이터베이스에 저장되는 데이터 구조와 제약 조건을 정의한 것이다. 그리고 저장된 실제 데이터 값은 인스턴스라고 한다. 스키마는 한번 정의되면 잘 바뀌지 않는 특성이 있지만 인스턴스는 계속 변하는 특징이 있다.

 

  • 3단계 데이터베이스 구조
    • 미국 표준화 기관인 ANSI/SPARC에서 데이터베이스의 복잡한 구조를 감추고 사용자가 데이터베이스를 쉽게 이해하고 이용할 수 있도록 단계별 추상화를 이용한 3단계 데이터베이스 구조를 제안하였다.  
      •  
     

  • 외부 단계
    • 외부 단계에서는 개별 사용자 관점에서 데이터베이스를 이해하고 표현한다. 사용자의 업무 내용과 사용 목적에 따라 데이터베이스를 생각하는 구조가 다르다. 이것을 외부 스키마라 하고 서브 스키마라고도 한다. 하나의 데이터베이스에 외부 스키마는 여러 개가 있을 수 있고 공유할 수 있다.

 

  • 개념 단계
    • 개념 단계에서는 데이터베이스를 이용하는 사용자들의 관점을 통합하여 데이터베이스를 조직 전체의 관점에서 이해하고 표현한다. 모든 사용자에게 필요한 데이터를 통합하여 전체 데이터베이스의 논리적 구조를 정의한다. 이것을 개념 스키마라 한다. 개념 스키마는 데이터간 관계, 제약조건, 보안 정책, 접근 권한을 포함하지만 데이터를 물리적으로 저장하는 방법이나 데이터 저장 장치와는 독립적이다. 하나의 데이터베이스에는 개념 스키마가 하나만 존재하며 일반적으로 스키마라 하면 개념 스키마를 의미한다.

 

  • 내부 단계
    • 내부 단계에서는 데이터베이스를 디스크나 테이프 같은 저장 장치의 관점에서 이해하고 표현한다. 전체 데이터베이스가 실제로 저장 장치에 저장되는 방법을 정의하며 이것을 내부 스키마라 한다. 내부 스키마는 파일에 데이터를 저장하는 레코드의 구조, 필드 크기, 인덱스를 이용한 레코드 접근 경로 등을 정의한다. 내부 스키마는 하나의 데이터베이스에 하나만 존재한다. 

데이터 독립성

하나의 데이터베이스에는 세 가지 유형의 스키마가 존재하지만, 각각의 스키마는 데이터베이스를 바라보는 관점만 다르고 모두 같은 데이터베이스를 표현한다. 사용자가 원하는 데이터를 얻으려면 외부 스키마 -> 내부 스키마를 거쳐 데이터베이스에 접근해야 하기 때문에 각 스키마 사이에 유기적인 대응 관계가 성립해야 한다. 이러한 대응관계를 사상 또는 매핑이라고 한다.
 
데이터베이스를 3단계로 나누고 단계별로 스키마를 만들어 대응시키는것은 데이터 독립성을 실현하기 위해서이다. 데이터 독립성은 하위 스키마를 변경하더라도 상위 스키마가 영향을 받지 않는 특성이다. 3단계 데이터베이스 구조에서는 논리적 데이터 독립성과 물리적 데이터 독립성이 존재한다.
 

  • 논리적 데이터 독립성
    • 논리적 데이터 독립성은 개념 스키마가 변경되더라도 외부 스키마가 영향을 받지 않는 것이다. 전체 데이터베이스의 논리적인 구조가 변경되더라도 관련된 외부/개념 사상(응용 인터페이스) 정보를 수정하면 외부 스키마를 변경할 필요가 없다.

 

  • 물리적 데이터 독립성
    • 물리적 데이터 독립성은 내부 스키마가 변경되더라도 개념 스키마가 영향을 받지 않는 것이다. 데이터베이스의 저장 구조가 변경되더라도 개념/내부 사상 (저장 인터페이스) 정보만 수정하면 논리적 구조는 영향을 받지 않는다.  

데이터 사전

저장된 데이터를 올바르게 관리하고 이용하려면 스키마, 사상 정보, 제약조건과 같은 부가 정보도 저장해야 한다. 이러한 부가 정보를 저장하는 곳을 데이터 사전 또는 시스템 카탈로그라고 한다. 이러한 부가 정보는 데이터를 위한 데이터이므로 메타 데이터라고도 한다. 데이터 사전에 실제로 접근하는데 필요한 위치 정보는 데이터 디렉터리에서 관리하며 데이터 사전은 사용자가 접근할 수 있지만 데이터 디렉터리는 시스템만 접근할 수 있다. 
 

데이터베이스 사용자

  • 데이터베이스 관리자
    • 데이터베이스 관리자는 데이터베이스 시스템을 운영, 관리한다. 조직 내 사용자를 위해 데이터베이스를 설계 및 구축하고 정상적인 서비스를 제공할 수 있도록 데이터 정의어와 데이터 제어어를 이용하여 데이터베이스를 제어한다.  
      • 데이터베이스 관리자 주요 업무
        • 데이터베이스 구성 요소 선정
        • 데이터베이스 스키마 정의
        • 물리적 저장 구조와 접근 방법 결정
        • 무결성 유지를 위한 제약조건 정의
        • 보안 및 접근 권한 정책 설정
        • 백업 및 회복 기법 정의
        • 시스템 데이터베이스(ex 데이터사전) 관리
        • 시스템 성능 감시 및 성능 분석
        • 데이터베이스 재구성
          • 사용자의 요구 사항이나 사용 형태가 달라짐
          • 시스템 전체 성능 향상
          • 시스템 장비 교체

 

  • 최종 사용자
    • 데이터를 조작(삽입, 삭제, 수정, 검색) 하기 위해 데이터베이스에 접근하는 사람들을 일반 사용자 또는 최종 사용자라고 하며 주로 데이터 조작어를 사용한다.
    • 캐주얼 사용자 : 데이터베이스에 대한 이론적 지식이 있으며 데이터 조작어를 이용하여 원하는 데이터와 처리 방법을 DBMS에 직접 설명한다.
    • 초보 사용자 : 데이터베이스를 초보 수준으로 이용하며 GUI 형태의 응용 프로그램을 통해 데이터베이스를 사용한다.

 

  • 응용 프로그래머
    • 응용 프로그래머는 프로그래밍 언어로 응용 프로그램을 작성할 때 데이터베이스에 접근하는 데이터 조작어를 삽입하는 사용자이며 데이터 정의어를 사용할 수 있지만 주로 데이터 조작어를 삽입한다.

데이터 언어

  • 데이터 정의어(DDL: Data Definition Language)
    • 데이터 정의어는 새로운 데이터베이스를 구축하기 위해 스키마를 정의하거나 기존 스키마의 정의를 삭제 또는 수정하기 위해 사용되는 데이터 언어이다. 데이터 정의어로 정의된 스키마는 데이터 사전에 저장되고, 삭제나 수정이 발생하면 이 내용도 데이터 사전에 반영된다. 

 

  • 데이터 조작어(DML : Data Manipulation Language)
    • 데이터 조작어는 사용자가 데이터의 삽입, 삭제, 수정, 검색 등의 처리를 DBMS에 요구하기 위해 사용하는 데이터 언어이다. 데이터 정의어를 이용하여 스키마를 정의하면 스키마에 따라 실제 데이터값(인스턴스)가 저장되는데 사용자가 실제 데이터 값을 활용하기 위해 사용하는 것이 데이터 조작어다.
      • 절차적 데이터 조작어
        • 절차적 데이터 조작어는 사용자가 어떤 데이터를 원하고 해당 데이터를 얻으려면 어떻게 처리해야 하는지 구체적으로 설명한다.
      • 비절차적 데이터 조작어 (선언적 언어)
        • 비절차적 데이터 조작어는 사용자가 어떤 데이터를 원하는지만 설명하고 해당 데이터를 어떻게 얻어야 하는지는 DBMS에 맡긴다. 

 

  • 데이터 제어어(DCL : Data Control Language)
    • 데이터 제어어는 데이터베이스에 저장된 데이터를 여러 사용자가 무결성과 일관성을 유지하며 문제없이 공유할 수 있도록 내부적으로 필요한 규칙이나 기법을 정의하는 데 사용되는 데이터 언어이다. 사용자는 데이터를 올바르게 관리하기 위한 규칙과 기법을 DBMS에 설명하고 DBMS는 이 규칙에 따라 데이터베이스를 제어하고 보호한다.
    • 데이터 제어어를 이용하면 보장되는 특성
      • 무결성 : 데이터베이스에 정확하고 유효한 데이터만 유지한다.
      • 보안 : 허가받지 않은 사용자가 데이터에 접근하는 것을 차단하거나, 허가된 사용자가 접근 권한이 있는 데이터에만 접근할 수 있도록 한다.
      • 회복 : 장애가 발생해도 데이터의 일관성을 유지한다.
      • 동시성 : 여러 사용자가 같은 데이터에 동시에 접근하여 처리할 수 있게 한다.

데이터베이스 관리 시스템의 구성

  • 질의 처리기 : 사용자의 데이터 처리 요구를 해석하여 처리하는 역할을 담당한다.
    • DDL 컴파일러
      • 데이터 정의어로 작성된 스키마의 정의를 해석한다. 그리고 저장 데이터 관리자의 도움을 받아 새로운 데이터베이스를 구축하고 스키마의 정의를 데이터 사전에 저장한다. 데이터 정의어로 작성된 기존 스키마의 삭제나 수정 요청도 처리하며, 변경된 내용을 데이터 사전에 적용한다.
    • DML 프리 컴파일러
      • 응용 프로그램에 삽입된 데이터 조작어를 추출하여 DML 컴파일러에 전달하며 데이터 조작과 관계없는 나머지 코드들은 해당 언어의 컴파일러에 보내진다.
    • DML 컴파일러
      • 데이터 조작어로 작성된 데이터의 처리(삽입, 삭제, 수정, 검색) 요구를 분석하여 런타임 데이터베이스 처리기가 이해할 수 있도록 해석한다.
    • 런타임 데이터베이스 처리기
      • 저장 데이터 관리자를 통해 데이터베이스에 접근하여 DML 컴파일러로부터 전달받은 데이터 처리 요구를 데이터베이스에서 실제로 실행한다.
    • 트랜잭션 관리자
      • 데이터베이스에 접근하는 과정에서 사용자의 접근 권한이 유효한지를 검사하고 데이터베이스 무결성을 유지하기 위한 제약조건 위반 여부를 확인하며 회복이나 병행 수행과 관련된 작업도 담당한다.

 

  • 저장 데이터 관리자
    • 저장 데이터 관리자는 디스크에 저장된 데이터베이스와 데이터 사전을 관리하고 운영체제의 도움을 받아 실제로 접근하는 역할을 담당한다. 

Q & A

본 도서의 내용을 정리한 것이 아닌 학습 스터디를 위해 제가 작성한 질답입니다.
사실과 다른 내용이 있다면 지적 부탁드립니다 :)

Q1 : 사용자가 데이터베이스 시스템을 이용할 때 어떤 일이 일어나는지 순서대로 말해주세요.

사용자는 먼저 컴퓨터를 이용하여 데이터베이스 시스템에 접근합니다. 그리고 데이터베이스 시스템에 데이터 언어로 원하는 데이터를 질의합니다. 데이터시스템은 사용자의 요구에 따라 데이터를 반환하고 데이터 처리 연산이 필요하다면 컴퓨터를 거쳐 데이터를 반환합니다.
 

 Q2 : 자바에서 인스턴스와 데이터베이스의 인스턴스의 차이를 말해주세요.

자바에서 인스턴스는 정의된 클래스를 이용하여 생성된 객체를 의미합니다. 반면에 DB에서의 인스턴스는 정의된 스키마에 따라 저장된 데이터 값을 의미합니다.
 

Q3 : 자바의 추상화와 3단계 데이터베이스의 추상화의 차이점을 말해주세요.

자바에서의 추상화는 OOP의 개념 중 하나로 구현 세부 사항을 숨기고 필요한 기능과 속성에만 집중하는 것을 말합니다. 반면에 3단계 데이터베이스의 추상화는 데이터베이스의 논리적인 구조를 표현하며 사용자가 데이터베이스를 쉽게 이해하고 사용할 수 있도록 도와줍니다.
 

Q4 : 데이터베이스 관리 시스템중 데이터 사전을 관리하는 것은 어떤 것이고, 어떻게 실제 파일에 접근하는지 말해주세요.

저장 데이터 관리자가 데이터 사전을 관리하며, 운영체제의 도움을 받아 디스크에 저장된 실제 파일에 접근합니다.
 

Q5 : 절차적 데이터 조작이 와 비절차적 데이터 조작 어중 현재 더 많이 쓰이는 것과 그 이유를 말해주세요.

현재는 비절차적 데이터 조작어가 더 많이 쓰입니다. 그 이유는 비절차적 데이터 조작어가 절차적 데이터 조작이에 비해 간단하고 직관적이기 때문에 데이터 조작이 쉽기 때문입니다. 또한 DBMS의 발전으로 쿼리옵티마이저 (Query Optimizer)가 다양한 실행 계획 중 최적의 계획을 실행하기 때문에 데이터 처리 성능을 높일 수 있습니다.
 
출처 : 김연희, 데이터베이스 개론 3판, 한빛아카데미(2022)