기본 콘텐츠로 건너뛰기

문자열 다루기

출처 카페 > 프로그래머들의 세계 | 필더
원문 http://cafe.naver.com/programmers/649

문자열 다루기

STL의 string을 사용

#include <TCHAR.h>
#include <string>
 
namespace std { typedef basic_string<TCHAR> tstring; }
To be continued...

static 함수 및 버퍼 사용
/**
 * Maps a character string to a wide-character (Unicode) string.
 * @param[in]   lpsz   ASCII string
 * @return             UNICODE string
 */
static WCHAR* ToWChar(LPCSTR* lpsz)
{
    static WCHAR wszBuffer[1024];
    _wcsset(wszBuffer, 0);
    int nWStrLen =          /* the number of wide characters written to the buffer */
        MultiByteToWideChar(
            CP_ACP,         /* CodePage: ANSI code page */
            0,              /* dwFlags: character-type options */
            lpsz,           /* lpMultiByteStr: string to map */
            -1,             /* cbMultiByte: number of bytes in string */
            wszBuffer,      /* lpWideCharStr: wide-character buffer */
            1024);          /* cchWideChar: size of buffer */
    return wszBuffer;
}
MultiByteToWideChar function
  • If cbMultiByte equals -1,
    the function processes the entire input string including the null terminator.
    The resulting wide character string therefore has a null terminator, and the returned length includes the null terminator.
  • If the function succeeds, and cchWideChar is nonzero,
    the return value is the number of wide characters written to the buffer pointed to by lpWideCharStr.
  • If the function succeeds, and cchWideChar is zero,
    the return value is the required size, in wide characters, for a buffer that can receive the translated string.
  • If dwFlag equals zero, the input string is UTF-8 and contains invalid characters
    the function returns ERROR_NO_UNICODE_TRANSLATION.
  • If the function fails, the return value is zero.
    To get extended error information, call GetLastError.
    GetLastError may return one of the following error codes:
    • ERROR_INSUFFICIENT_BUFFER
    • ERROR_INVALID_FLAGS
    • ERROR_INVALID_PARAMETER
    • ERROR_NO_UNICODE_TRANSLATION
/**
 * Maps a wide-character string to a character string.
 * @param[in]   lpwsz   UNICODE string
 * @return              ASCII string
 */
static LPSTR ToAChar(const WCHAR* lpwsz)
{
    static char szBuffer[1024];
    _strset(szBuffer, 0);
    int nAStrLen =          /* the number of bytes written to the buffer. */
        WideCharToMultiByte(
            CP_ACP,         /* CodePage: ANSI code page */
            0,              /* dwFlags: performance and mapping flags */
            lpwsz,          /* lpWideCharStr: wide-character string */
            -1,             /* cchWideChar: number of chars in string */
            szBuffer,       /* lpMultiByteStr: buffer for new string */
            1024,           /* cbMultiByte: size of buffer */
            NULL,           /* lpDefaultChar: default for unmappable chars */
            NULL);          /* lpUsedDefaultChar: set when default char used */
    return szBuffer;
}
  • WideCharToMultiByte function
    • If cchWideChar equals -1,
      the string  is assumed to be null-terminated and the length is calculated automatically.
      The length will include the null-terminator.
    • If the function succeeds, and cbMultiByte is nonzero,
      the return value is the number of bytes written to the buffer pointed to by lpMultiByteStr.

      The number includes the byte for the null terminator.
    • If the function succeeds, and cbMultiByte is zero,
      the return value is the required size, in bytes, for a buffer that can receive the translated string.
    • If the function fails, the return value is zero.
      To get extended error information, call GetLastError.
      GetLastError may return one of the follwing error codes:
      • ERROR_INSUFFICIENT_BUFFER
      • ERROR_INVALID_FLAGS
      • ERROR_INVALID_PARAMETER

In GDI+, all the parameters about the symbol are WCHAR type.

Examples

char szSrc[] = "유니코드 변환 예제";
BSTR wsDst;   /* 유니코드 변수 */
;
int nSrcLen = strlen(szSrc);
int nDstLen = MultiByteToWideChar(CP_ACP, 0, szSrc, nSrcLen, NULL, NULL);
wsDst = (BSTR)SysAllocStringLen(NULL, nDstLen);
MultiByteToWideChar(CP_ACP, 0, szSrc, nSrcLen, wsDst, nDstLen);
;
SysFreeString(wsDst);
  • MultiByteToWideChar function
    • If cchWideChar equals zero,
      the function returns the required buffer size, in wide charcters,
      and makes no use of the lpWideCharStr buffer.
    • If the function succeeds, and cchWideChar is zero,
      the return value is the required size, in wide characters, for a buffer that can receive the translated string.

BSTR wsSrc = L"아스키코드로 변환 예제";
char* szDst = NULL;
;
int nDstLen = WideCharToMultiByte(CP_ACP, 0, wsSrc, -1, szDst, 0, NULL, NULL);
szDst = new char[nDstLen + 1];
WideCharToMultiByte(CP_ACP, 0, wsSrc, -1, szDst, ,NULL, NULL);
;
delete [] szDst;
  • WideCharToMultiByte function
    • If cbMultiByte equals zero,
      the function returns the number of bytes required for the buffer.
      In this case, the lpMultiByteStr buffer is not used.
    • If the function succeeds, and cbMultiByte is zero,
      the return value is the required size, in bytes, for a buffer that can receive the translated string.

ANSI to UTF-8

char* pszANSI = "ANSI string";
int nAStrLen, nBStrLen, nU8StrLen;
BSTR bstr;
char* pszUTF8 = NULL;
;
nAStrLen = lstrlen(pszANSI);
nBStrLen = MultiByteToWideChar(CP_ACP, 0, pszANSI, nAStrLen, NULL, NULL);
bstr = SysAllocStringLen(NULL, nBStrLen);
MultiByteToWideChar(CP_ACP, 0, pszANSI, nAStrLen, bstr, nBStrLen);
;
nU8StrLen = WideCharToMultiByte(CP_UTF8, 0, bstr, -1, pszUTF8, 0, NULL, NULL);
pszUTF8 = new char[nU8StrLen + 1];
WideCharToMultiByte(CP_UTF8, 0, bstr, -1, pszUTF8, nU8StrLen, NULL, NULL);
SysFreeString(bstr);
;
delete [] pszUTF8;

UTF-8 to ANSI

char* pszUTF8;   /* UTF-8 string */
int nU8StrLen, nBStrLen, nAStrLen;
BSTR bstr;
char* pszANSI;
;
nU8StrLen = lstrlen(pszUTF8);
nBStrLen = MultiByteToWideChar(CP_UTF8, 0, pszUTF8, nU8StrLen + 1, NULL, NULL);
bstr = SysAllocStringLen(NULL, nBStrLen);
MultiByteToWideChar(CP_UTF8, 0, pszUTF8, nU8StrLen + 1, bstr, nBStrLen);
;
nAStrLen = WideCharToMultiByte(CP_ACP, 0, bstr, -1, NULL, 0, NULL, NULL);
pszANSI = new char[nAStrLen];
WideCharToMultiByte(CP_ACP, 0, bstr, -1, pszANSI, nAStrLen, NULL, NULL);
SysFreeString(bstr);
;
delete [] pszANSI;

Definitions of Different Type of Strings

/* 16-bit wide(UNICODE) character */
typedef unsigned short   wchar_t
typedef wchar_t          WCHAR;
 
/* 16-bit UNICODE string */
typedef WCHAR                      OLECHAR;
typedef OLECHAR _RPC_FAR          *LPOLESTR;
typedef const OLECHAR __RPC_FAR   *LPCOLESTR;
 
/* 8-bit multi-byte/ANSI string */
typedef char         CHAR;
typedef CHAR         *LPSTR, *PSTR;
typedef const CHAR   *LPCSTR, *PCSTR;
typedef char         TCHAR, *PTCHAR;

CString <=> Multibyte String

int test_str(LPCTSTR lpStr);
CString cstr("dozob's knowledge note");
 
/* CString::GetBuffer returns a pointer to its underlying buffer. */
LPSTR lpsz = cstr.GetBuffer(cstr.GetLength());
 
/* Both cstr and lpsz can access the underlying buffer. */
test_str(cstr);
test_str(lpsz);
 
/* You can amend the buffer through cstr. */
cstr = "01234567";
test_str(lpsz);
 
/* You can also amend the buffer through lpsz, but you cannot free it. */
lpsz[8] = '!';
test_str(cstr);
// free(lpsz);   /* Not allowed! Will cause run-time error! */
 
/* After releasing the buffer, lpsz's content becomes undefined. */
cstr.ReleaseBuffer();
test_str(cstr);
 
/* If you want to avoid amending the original content of the CString, make a copy. */
LPSTR lpszCopy = (LPSTR)malloc(strlen(lpsz));
memset(lpszCopy, 0, strlen(lpsz) + 1);
strcopy(lpszCopy, lpsz);
test_str(lpszCopy);

CString <=> Wide Character String

void CStringToWideChar(CString cstr, wchar_t* pwchar, int size)
{
    int cstrLen = cstr.GetLength();
    ASSERT( cstrLen < MAX_LENGTH );
    MultiByteToWideChar(CP_ACP, MB_PRECOMPOSED,
        cstr.GetBuffer(cstrLen), cstrLen, pwchar, size);
    cstr.ReleaseBuffer();
}

Allocating and Freeing BSTRs with API Functions

BSTR stands for basic string.
It is a 16-bit Unicode with a prefix telling the count of the bytes in this string, therefore do not need NULL at the end.
When a server creates and passes out a BSTR, the server allocates memory space for the BSTR,
while the client should deallocate the memory with a call to API function SysFreeString.

  • Creating a new BSTR
  • BSTR bstr1 = SysAllocString(L"BSTR string");
    OLECHAR* pOleStr = OLESTR("OLE string");
    BSTR bstr2 = SysAllocString(pOleStr);
    
    Modifying a BSTR
    SysReAllocString(&bstr1, L"new BSTR string");
    Freeing a BSTR
    SysFreeString(bstr1);
    SysFreeString(bstr2);
    
    BSTR <=> CString
    CString cstr("MFC String");
    BSTR bstr = cstr.AllocSysString();
     
    
    BSTR bstr = SysAllocString(L"BSTR string");
    CString cstr(bstr);
    
    BSTR <=> Multibyte String
    BSTR bstr = SysAllocString(L"BSTR string");
    char szBuffer[80];
     
    /* wide character string to multibyte string */
    wcstombs(szBuffer, bstr, 80);
    SysFreeString(bstr);
     
    sprintf(szBuffer, "Multibyte string");
    /* multibyte string to wide character string */
    mbstowcs(bstr, szBuffer, 80);
    
    Multibyte String <=> Wide Character String
    char* mbstr = "multibyte string";
    ;
    wchar_t wcBuffer[80];
    int mbsLen = strlen(mbstr);
    int wcsLen = sizeof(wcBuffer) / sizeof(wchar_t);
    ::memset(wcBuffer, 0, sizeof(wcBuffer));
    /* dwFlag = MB_PRECOMPOSED
     *  Always use precomposed characters that is, characters
     *   in which a base character and a nonspacing character have a single character value.
     *  This is the default translation option. 
     */
    MultiByteToWideChar(
        CP_ACP, MB_PRECOMPOSED,
        mbstr, mbsLen,
        wcBuffer, wcsLen);
    ;
    char szBuffer[256];
    /* Type Field Character: S
     *  specifies a wide-character string;
     */
    sprintf(szBuffer, "wcBuffer = %S", wcBuffer);
    ::MessageBox(NULL, szBuffer, NULL, MB_OK);
    wchar_t wcstr = L"wide character string";
    wcsLen = wcslen(wcstr);
    ;
    char mbBuffer[256];
    mbsLen = sizeof(mbBuffer);
    ::memset(mbBuffer, 0, mbsLen);
    /* dwFlags = WC_COMPOSITECHECK
     *  Convert composite characters to precomposited characters.
     */
    WideCharToMultiByte(
        CP_ACP, WC_COMPOSITECHECK,
        wcstr, wcsLen,
        mbBuffer, mbsLen,
        NULL, NULL);
    ::MessageBox(NULL, mbBuffer, NULL, MB_OK);
    
    Converting with ATL Macros
    ATL provides a group of macros to convert between different types.
    Because one convertion involves a series of temporary variables to hold and swap the string buffers,
    the space is prepared by macro USES_CONVERSION, which should be called before any conversion.
    They are defined in <atlconv.h>.
     ANSI to ...OLE to ...WCHAR to ...TCHAR to ...
    ANSI OLE2AW2AT2A
    cosnt ANSI OLE2CAW2CAT2CA
    OLEA2OLE W2OLET2OL
    const OLEA2COLE W2COLET2COLE
    WCHARA2WOLE2W T2W
    const WCHARA2CWOLE2CW T2CW
    TCHARA2WOLE2TW2T 
    const TCHARA2CWOLE2CTW2CT 
    BSTRA2BSTROLE2BSTRW2BSTRT2BSTR
    1. USES_ONVERSION;
    2. ::MessageBox(NULL, W2A(bstr), NULL, MB_OK);

    MFC's BSTR Helper Class _bstr_t

    MFC provides class _bstr_t to wrap BSTR.
    _bstr_t's constructor can take many types as input:
    1. _bstr_t() throw();
    2. _bstr_t(const _bstr_t& s1) throw();
    3. _bstr_t(const char* s2) throw(_com_error);
    4. ;
    Its assignment operator = is also overloaded for many types:
    1. ...
    It has also overloaded +=, +, ! and all comparison operators.

    To get a LPTSTR from _bstr_t:
    1. _bstr_t bstrt("bstr_t string");
    2. LPTSTR lptstr = (LPTSTR)bstrt;

    You can use _bstr_t anywhere expecting BSTR.
    If you like, you can also explicitly cast _bstr_t to BSTR:
    1. _bstr_t bstrt("bstr_t string");
    2. BSTR bstr = (BSTR)bstrt;
    3. SysFreeString(bstr);
    _bstr_t object does not need to be deallocated.
    It is deallocated automatically when it leaves scope.
    Class _bstr_t is contained in header file <comdef.h>.

    ATL's BSTR Helper Class CComBSTR

    ATL also provides a wrapper class CComBSTR, which is more light than _bstr_t.
    CComBSTR wraps a BSTR data member m_str.
    Space for BSTR is allocated in its constructor and dealocated in the destructor.
    Its constructor can take LPCOLESTR or LPCSTR as input.
    It can also designate the size of the buffer.
    CComBSTR(int nSize);
    CComBSTR(int nSize, LPCOLESTR sz);
    CComBSTR(int nSize, LPCSTR sz);
    CComBSTR(LPCOLESTR pSrc);
    CComBSTR(LPCSTR pSrc);
    CComBSTR(const CComBSTR& src);
     
    BSTR bstr = SysAllocString(L"BSTR string");
    CComBSTR comBstr;
    /* attach a BSTR to a CComBSTR */
    comBstr.Attatch(bstr);
    /* detach m_str from CComBSTR */
    bstr = comBstr.Detach();
    
    CComBSTR comBstr = L"CComBSTR string";
    /* get a copy of m_str */
    BSTR bstrCopy = comBstr.Copy();
    /* get the address of m_str */
    BSTR* pBstr = &comBstr;
    /* free m_str */
    comBstr.Empty();
    
    CComBSTR comBstr = L"CComBSTR string";
    /* CComBSTR can only be casted to CString,
     *  which can be than casted to LPCSTR or LPCTSTR.
     */
    CString cstr = (CString)comBstr;
    
    CComBSTR is contained in header file <atlbase.h>, which also contains other wraper clases.

    Reference sites


    http://progtutorials.tripod.com/COM.htm

댓글

댓글 쓰기

이 블로그의 인기 게시물

80040154 오류로 인해 CLSID가 {xxxx-...}인 구성 요소의 COM 클래스 팩터리를 검색하지 못했습니다.

원문보기 .NET 으로 만든 응용프로그램에서 com 객체를 호출한 경우 Windows7 64bit 에서 제목과 같은 에러가 발생했다. Win32 COM 과 .NET 프로그램간의 호환성 때문에 생긴 문제였다. 원인은 .NET 실행시 JIT 컴파일러에 의해 최적화된 기계어로 변환되기 때문.. Win32 COM은 컴파일시.. Win32 COM에 맞춰 빌드 속성에서 하위버전으로 맞춰 컴파일을 다시하는 방법도 있지만 메인 프로젝트가 .NET이라면 참조되는 모든 프로젝트를 다 바꿔야할 노릇.. 또 다른 방법은 COM+를 이용하여 독립적으로 만드는 것이다. 분리시키는 방법은 아래 주소해서 확인할 수 있다. http://support.microsoft.com/kb/281335 나의 경우는 Win32 COM DLL을 64비트 .NET 프로그램에서 참조하니 COM 객체를 제대로 호출하지 못하였습니다. 그래서 .NET 프로그램의 Target Machine을 x86으로 설정하니 제대로 COM 객체를 호출하였습니다.

[Pyinstaller] 실행 파일 관리자 권한 획득하기

고객사에서 일부 사용자에게서 프로그램 오류가 발생한다며 아래와 같이 에러 캡처를 보내왔습니다. 프로그램에서 로그를 남기기 위해 로그 파일을 생성하는데 권한의 문제로 로그 파일을 생성하지 못해 프로그램 오류가 발생한 것 같습니다. 처음에는 Python 코드에서 관리자 권한을 요청하는 코드를 넣으려고 했는데, 실제로 Stackoverflow를 찾아보면 이런 내용이 나옵니다. 프로그램이 관리자 권한으로 실행되지 않았다면 관리자 권한으로 다시 프로그램을 실행시키는 코드입니다. import os import sys import win32com.shell.shell as shell ASADMIN = 'asadmin' if sys.argv[-1] != ASADMIN: script = os.path.abspath(sys.argv[0]) params = ' '.join([script] + sys.argv[1:] + [ASADMIN]) shell.ShellExecuteEx(lpVerb='runas', lpFile=sys.executable, lpParameters=params) sys.exit(0) 하지만 개인적으로 이런 방식은 마음에 들지 않았고 조금 더 찾아보니 Pyinstaller로 exe 파일을 만들 때 옵션을 설정하여 관리자 권한을 요청하도록 할 수 있다고 합니다. --uac-admin을 옵션에 추가하면 프로그램 실행 시 관리자 권한을 요청할 수 있습니다. pyinstaller.exe --uac-admin sample.py 하지만 안타깝게도 이 방식은 원하는 대로 동작하지 않았습니다. 마지막으로 manifest 파일을 이용하여 시도해보았습니다. spec 파일을 이용하여 pyinstaller로 빌드하면 <실행 파일 이름>.manifest 라는 파일이 생성됩니다. 파일에서 아랫부분을 찾아볼 수 있습니다. <security> <re...

초간단 프로그램 락 걸기

프로그램에 락을 걸 일이 생겨났다. 하드웨어 락을 걸면 쉬울텐데 그 정도는 아니고 프로그램의 실행 날짜를 제한 해 달라고 한다. 그래서 파일(license.lic)을 가지고 락을 걸리고 결정을 했다. 요구 사항은 아래와 같다. 1. license.lic 파일이 없으면 프로그램을 실행 할수 없게 한다. 2. 지정한 날짜를 넘어서는 프로그램을 실행 할수 없게 한다. 3. 사용자가 시스템 날짜를 되돌렸을때 인식하여 프로그램을 실행 할수 없게 한다. 음.... 1.번 문제는 사용자가 프로그램을 실행하기 위해서 license.lic 파일을 받아야만 한다. license.lic 파일에는 최근 실행 날짜/종료날짜 이런식으로 적도록 한다.(물론 내용은 암호화 한다.) 최근 실행날짜는 프로그램이 실행때마다 업데이트 하도록 하고 시스템 날짜와 비교하여 시스템 날짜가 최근 실행 날짜보다 이전의 날짜면 시스템 날짜를 되돌렸다고 인식하도록 한다.(3.번 문제 해결) 시스템 날짜와 종료 날짜를 비교하여 시스템 날짜가 종료 날짜를 넘으면 프로그램을 실행 할수 없도록 한다.(2.번 문제 해결)