其他分享
首页 > 其他分享> > bstr_t与BSTR

bstr_t与BSTR

作者:互联网

转:https://blog.csdn.net/dyzhen/article/details/19398829

bstr_t与BSTR

   

问题:

BSTR   a   =   _bstr_t("a");

BSTR   b   =   _bstr_t("b"); 
CString   c   ; 
c   =   a; 
MessageBox(c); 
c   =   b; 
MessageBox(c); 
为什么消息框中显示的都是   b? 
如果这样: 
    _bstr_t   bstr1("a"); 
BSTR   a   =   bstr1; 
_bstr_t   bstr2("b"); 
BSTR   b   =   bstr2; 
CString   c   ; 
c   =   a; 
MessageBox(c); 
c   =   b; 
MessageBox(c); 
消息框中显示就对了!

Answer:

首先要明确,_bstr_t是对BSTR的封装。 
   
Code   1: 
   
BSTR   a   =   _bstr_t("a"); 
//这里,_bstr_t("a")只是临时对象,当它初始化(包含一个内部的BSTR)并赋值给BSTR   a之后

,它就被撤销了。而它赋的值是BSTR的地址。 
BSTR   b   =   _bstr_t("b"); 
//第二次,仍然产生一个临时对象,它也初始化...过程跟上面一样。而且,由于前面的_bstr_t对

象已被撤销,所以它产生BSTR的地址也同上。 
//所以,实际上a,b指向同一个地址。而该地址的内容被写了两次。 
   
Code   2: 
   
_bstr_t   bstr1("a"); 
BSTR   a   =   bstr1; 
_bstr_t   bstr2("b"); 
BSTR   b   =   bstr2; 
//这里的两个_bstr_t   bstr1,bstr2都是局部对象,同时存在。所以,他们内部包含的BSTR的地

址不一样。这样分别赋值就没问题。



#if   defined(WIN32)   &&   !defined(OLE2ANSI) 
typedef   WCHAR   OLECHAR; 
#else 
typedef   char   OLECHAR; 
#endif 
typedef   OLECHAR*   BSTR; 
   
实际上BSTR就是直接指向字符串的首地址(双字节或者ANSI字符串)。 
而BSTR之前的四个字节是该字符串的长度,由编译器生成的代码自动去读这个长度,而不是用"\0"

来标识字符串的结束。


BSTR字符串有以下几个要点要强调一下: 
1.一个BSTR字符串变量实际上是一个指针变量。它占用32bit即4个字节,就像其它的指针一样。

而且,它指向一个Unicode格式的字符数组。但是,我们不能把字符串与BSTR字符串等同起来。我们

必须用它自己确切的名字――“BSTR“。 
2.一个BSTR字符串变量指向的字符串数组必须由4个字节的保留字开始(保存字符串数组的字节数

而不是字符数),由2个空字符结束。 
3.由于空字符在Unicode格式的字符串中的任何位置都有可能出现,所以,以空字符声明一个

Unicode格式的字符串的结束并不合适。因此,在4个保留字中保存字符串的长度是至关重要的。 
4.我们再强调一下,BSTR字符串指针实际指向的是Unicode格式的字符数组的首地址,而不是开头

的4个字节。接下来我们就会看到,在这儿这样不厌其烦地强调BSTR字符串变量的特征是为了与马上

就要解释的VC++中的string类型作个比较。 
5.前4个字节的length记录的是字符数组的字节数(注意,不是字符数),包括结尾的空字节。因

为数组是Unicode格式的,所以实际字符是length的一半。 
在这儿强调一下,一个Unicode格式的空字符其实是占用2个字节的空间,而不是1个字节。在

Unicode格式的数组中测试空字符时要当心这一点。 
我们一般在惯例上说BSTR字符串“help”是“一个BSTR类型的字符串”。一般公认为,一个BSTR字

符串变量指向的一个字符数组中包括至少两个空字符。 
就Visual   Basic来说,BSTR字符串未尾的两个空字节可能没什么用处,但是对Win32来说,它们

却是至关重要的。原因在于,Win32版本的Unicode   String(它称为LPWSTR)定义为指向一个空字

符结尾的Unicode格式的字符串的指针。 
从这个原因上解释BSTR字符串为什么要以空字符结尾就合情合理了。下面让我们讨论一下C++类型

的string变量。 
两句代码: 
Dim   str   as   String 
str=”help” 
str表示的是一个BSTR字符串变量的名字,而不是一个Unicode格式的字符数组。换句话说,str是

一个保存地址xxxx的变量的名字。 
以下是个小小的实验,它表明Visual   Basic中string变量是指向字符数组的指针而不是字符数组

。下面定义了一个结构,它的成员变量的类型是string。 
Private   Tyep   utTest 
astring   As   String 
bstring   As   String 
End   Type 
Dim   uTest   As   utTest 
Dim   s   as   String 
s=”testing” 
uTest.astring=”testing” 
uTest.astring=”testing” 
Debug.Print   Len(s) 
Debug.Print   Len(uTest) 
这几句代码的执行结果是: 


对string变量来说,Len函数返回的是字符串数组的字符个数。所以7个字符的字符串“testing”

返回7。对结构变量uTest来说,Len函数返回的是该结构占用的内存空间。所以返回值8清楚地表明了

每一个BSTR变量在内存中占用4个字节。因为BSTR是一个Win32的指针! 
C类型的LPSTR和LPWSTR   字符串 
Visual   C++使用LPSTR和LPWSTR字符串。 
LPSTR类型字符串的定义是:指向一个空字节结尾的ANSI格式的字符串数组的指针。但是,因为我

们是以空字节的位置来判断LPSTR字符串的终止的,所以,在LPSTR中是不允许字符串中还有第二个空

字节存在。同样,LPWSTR是一个指向空字节终止的Unicode格式的字符串的指针,它的中间也不允许

有空字节存在。LPWSTR中的W指Wide,它是微软对Unicode的另一种说法。 
   
可能我们也会碰到LPCSTR和LPCWSTR类型的字符串。其中的C表示Constant(常量)。这种字符串是

不能被API函数修改的。除此以外,LPCSTR都与LPSTR相同。同理,LPCWSTR除不能修改外,其它的都

与LPWSTR相同。 
再说LPTSTR,LPTSTR一般都用在条件编译中,就象TCHAR一样。以下是一个例子代码: 
#ifdef     UNICODE 
typedef   LPWSTR   LPTSTR;             //   在Unicode下LPTSTR与LPWSTR是相同的 
typedef   LPCWSTR   LPCTSTR;         //   在Unicode下LPCTSTR与LPCWSTR是相同的 
#else        
typedef   LPSTR   LPTSTR;               //在ANSI下LPTSTR与LPSTR是相同的 
typedef   LPCSTR   LPCTSTR;           //在ANSI下LPTCSTR与LPCSTR是相同的 
#endif

标签:Unicode,字节,BSTR,数组,bstr,字符串
来源: https://www.cnblogs.com/CipherLab/p/14874711.html