문자셋의 종류와 특성에 대해 알아보자!

in #kr-dev6 years ago

안녕하세요!! @wonnieyoon입니다.
오늘은 문자셋에대해 포스팅하겠습니다.

아스키코드와 유니코드는 대표적인 문자셋이라고 할수 있습니다.
아스코드는 미국에서 정의하고 있는 표준인데 알파벳의 개수는 얼마 되지 않고 기타적인 기호들을 포함해도 256개 즉, 1Byte를 넘지 않습니다. 그렇기 때문에 아스키코드를 사용해도 되지만 다른 국가에서 사용하는 문자를 표현하기에는 아스키코드로 표현을 할수 없기 때문에 등장한것이 유니코드 입니다.
유니코드는 모든 문자를 2Byte로 표현한다는 특징이 있습니다. 2Byte는 65,536개의 문자를 표현할수 있기 때문에 전세계의 모든 문자를 표현할수 있습니다.

문자셋에 대해 좀더 알아보겠습니다.

문자셋이란?
약속된 문자의 표현방법이라고 합니다.

  • SBCS ( Single Byte Character Set)
    Single Byte라는 말에서 어느정도 느낌이 왔을텐데요ㅎ
    문자를 표현할때 무조건 1Byte를 사용하는 방식입니다.
    아스키코드가 대표적인 SBCS에 해당합니다.

  • MBCS(Multi Byte Character Set)
    Multi Player란 무엇을 말하죠?
    이것저것 잘하는 만능이라는 뜻으로 많이 쓰는데요.
    Multi Byte도 비슷합니다.
    여기에선 2Byte 저기에선 1Byte를 사용하기 때문에 붙여진 이름입니다.
    주의하셔야 할점은 유니코드는 무조건 2Byte를 쓰고 MBCS는 2Byte도 씁니다.
    즉, 유니코드는 MBCS에 속하지 않습니다.
    MBCS에서 영어는 1Byte, 한글은 2Byte를 사용합니다.
    어떻게 보면 효율적으로 사용한다고 생각할수 있겠지만 요즘은 메모리도 크고
    무엇보다 서로 다르다는것은 그만큼 주의를 기울여야 한다는 의미입니다.

  • WBCS(Wide Byte Character Set)
    유니코드는 WBCS 방식에 들어갑니다.
    WBCS는 모든 문자를 2Byte로 처리하는 방식입니다.

Sort:  

(jjangjjangman 태그 사용시 댓글을 남깁니다.)
[제 0회 짱짱맨배 42일장]3주차 보상글추천, 1,2주차 보상지급을 발표합니다.(계속 리스팅 할 예정)
https://steemit.com/kr/@virus707/0-42-3-1-2

3주차에 도전하세요

그리고 즐거운 스티밋하세요!

Coin Marketplace

STEEM 0.22
TRX 0.27
JST 0.041
BTC 104021.29
ETH 3869.26
SBD 3.33