기본 콘텐츠로 건너뛰기

c++로) unicode를 multi-byte character로 변환하려고 하는데

출처 :  http://tong.nate.com/thisbe71/24531681

안녕하세요.

일단 문자세트, 테이블에 대해서 조금 이야기를 할까 합니다.
SBCS(Single Byte Character Set)
DBCS(Double Byte Character Set)
MBCS(Multi Byte Charecter Set)
WBCS(Wide Byte Charecter Set)
4종류의 테이블이 있습니다.

옛날 ASCII 코드라고 들어보신 적이 있으실까 모르겠습니다.
이넘들이 1바이트를 가지고 문자를 표현했었습니다.
1바이트니까 256개의 문자를 표현할 수 있지요.
그것이 저 위에 있는 SBCS입니다.
그러다가 한글도 써야 되고 일어도 써야 되고 한문도 써야 되지요...
그것을 위해서 만들어진 것이 바로 DBCS입니다.
한글을 쉽게 쓸 수 있어서 좋긴하지만 문제가 발생했습니다.
SBCS와 DBCS가 호환이 되지 않았던 겁니다.
그래서 저거 두개 묶어 쓰자...라고 나온 것이 MBCS이구요.
하지만 MBCS 내부에서 호환이 되지 않았기 때문에 앗싸리 바이트를 여러개 써서 모든 문자를 표현하기 위해서 나온 것이 바로 WBCS입니다.
multi-byte characater는 바로 MBCS이구요.

유니코드는 WBCS랍니다.

자~ 그럼 왜 WBCS에서 MBCS로 바꿔야 할까요.
그것은 바로 윈도우즈 운영체제 때문입니다.
윈도우즈 95, 98, me 계열, 9x계열들은 MBCS를 사용했었습니다.
그러다가 윈도우즈 2000 넘어가면서부터 WBCS를 사용하게 되었는데요.
물론 윈도우즈 2000이상급들에서도 MBCS를 사용할 수 있긴 하지만 9x계열에서는 WBCS를 사용할 수가 없죠.
프로그램의 운영체제간 호환성을 위해서 어쩔 수 없이 써야하는 것이랍니다.
여기까지 대략적인 문자세트를 설명했구요.

이제 답변을...

624b -> 이렇게 있으면 '手'이 뮨자가 나와야 한다는 건가여?
==> 네 그렇습니다. 유니코드는 전세계 모든 문자를 담고 있습니다.

그렇다면
유니코드의 테이블과 각 유니코드가 가리키는 문자를 가지고 있다가
624b찾아서 저 문자(手)를 돌려주어야 하는건가여?
==> 그렇습니다. 유니코드 테이블에서 624b 자리에 해당되는 문자를 출력합니다.

unicode의 개념은 정확히 알겠는데
multi-byte character로 변환한다. 라는 말이 머리에 제대로 들어오지 않습니다.
==> MBCS는 SBCS(1바이트로 표현되는 문자세트)와 DBCS(2바이트로 표현되는 문자세트)의 조합입니다. WBCS는 여러바이트를 사용하여 문자를 나타내기 때문에 호환이 되지 않습니다.
==> 따라서 호환이 되기 위해서는 영어문자에 대해서 1바이트로, 한글 등은 2바이트로 나타낼려면 변환이 필요합니다.

여담이지만 WBCS는 전세계 모든 문자를 표현할 수 있구요. MBCS는 언어(한글, 일본어, 중국어 등)에 관계없이 동일한 영역을 사용합니다.

이 차이는 유니코드로는 전세계 모든 문자 소화가능이구요. MBCS는 특정 언어셋을 사용한다라고 선언해줘야 그 언어셋에 한해서만 사용이 가능하다는 뜻이 됩니다.

출처 : Tong - 통동이님의 프로그램밍 일반통

댓글

이 블로그의 인기 게시물

80040154 오류로 인해 CLSID가 {xxxx-...}인 구성 요소의 COM 클래스 팩터리를 검색하지 못했습니다.

원문보기 .NET 으로 만든 응용프로그램에서 com 객체를 호출한 경우 Windows7 64bit 에서 제목과 같은 에러가 발생했다. Win32 COM 과 .NET 프로그램간의 호환성 때문에 생긴 문제였다. 원인은 .NET 실행시 JIT 컴파일러에 의해 최적화된 기계어로 변환되기 때문.. Win32 COM은 컴파일시.. Win32 COM에 맞춰 빌드 속성에서 하위버전으로 맞춰 컴파일을 다시하는 방법도 있지만 메인 프로젝트가 .NET이라면 참조되는 모든 프로젝트를 다 바꿔야할 노릇.. 또 다른 방법은 COM+를 이용하여 독립적으로 만드는 것이다. 분리시키는 방법은 아래 주소해서 확인할 수 있다. http://support.microsoft.com/kb/281335 나의 경우는 Win32 COM DLL을 64비트 .NET 프로그램에서 참조하니 COM 객체를 제대로 호출하지 못하였습니다. 그래서 .NET 프로그램의 Target Machine을 x86으로 설정하니 제대로 COM 객체를 호출하였습니다.

[Pyinstaller] 실행 파일 관리자 권한 획득하기

고객사에서 일부 사용자에게서 프로그램 오류가 발생한다며 아래와 같이 에러 캡처를 보내왔습니다. 프로그램에서 로그를 남기기 위해 로그 파일을 생성하는데 권한의 문제로 로그 파일을 생성하지 못해 프로그램 오류가 발생한 것 같습니다. 처음에는 Python 코드에서 관리자 권한을 요청하는 코드를 넣으려고 했는데, 실제로 Stackoverflow를 찾아보면 이런 내용이 나옵니다. 프로그램이 관리자 권한으로 실행되지 않았다면 관리자 권한으로 다시 프로그램을 실행시키는 코드입니다. import os import sys import win32com.shell.shell as shell ASADMIN = 'asadmin' if sys.argv[-1] != ASADMIN: script = os.path.abspath(sys.argv[0]) params = ' '.join([script] + sys.argv[1:] + [ASADMIN]) shell.ShellExecuteEx(lpVerb='runas', lpFile=sys.executable, lpParameters=params) sys.exit(0) 하지만 개인적으로 이런 방식은 마음에 들지 않았고 조금 더 찾아보니 Pyinstaller로 exe 파일을 만들 때 옵션을 설정하여 관리자 권한을 요청하도록 할 수 있다고 합니다. --uac-admin을 옵션에 추가하면 프로그램 실행 시 관리자 권한을 요청할 수 있습니다. pyinstaller.exe --uac-admin sample.py 하지만 안타깝게도 이 방식은 원하는 대로 동작하지 않았습니다. 마지막으로 manifest 파일을 이용하여 시도해보았습니다. spec 파일을 이용하여 pyinstaller로 빌드하면 <실행 파일 이름>.manifest 라는 파일이 생성됩니다. 파일에서 아랫부분을 찾아볼 수 있습니다. <security> <re

초간단 프로그램 락 걸기

프로그램에 락을 걸 일이 생겨났다. 하드웨어 락을 걸면 쉬울텐데 그 정도는 아니고 프로그램의 실행 날짜를 제한 해 달라고 한다. 그래서 파일(license.lic)을 가지고 락을 걸리고 결정을 했다. 요구 사항은 아래와 같다. 1. license.lic 파일이 없으면 프로그램을 실행 할수 없게 한다. 2. 지정한 날짜를 넘어서는 프로그램을 실행 할수 없게 한다. 3. 사용자가 시스템 날짜를 되돌렸을때 인식하여 프로그램을 실행 할수 없게 한다. 음.... 1.번 문제는 사용자가 프로그램을 실행하기 위해서 license.lic 파일을 받아야만 한다. license.lic 파일에는 최근 실행 날짜/종료날짜 이런식으로 적도록 한다.(물론 내용은 암호화 한다.) 최근 실행날짜는 프로그램이 실행때마다 업데이트 하도록 하고 시스템 날짜와 비교하여 시스템 날짜가 최근 실행 날짜보다 이전의 날짜면 시스템 날짜를 되돌렸다고 인식하도록 한다.(3.번 문제 해결) 시스템 날짜와 종료 날짜를 비교하여 시스템 날짜가 종료 날짜를 넘으면 프로그램을 실행 할수 없도록 한다.(2.번 문제 해결)