键字:HTML Element, Sink
1、概述
实现了对Webbrowser的resuing之后我们便会发现有时候我们还需要处理浏览器中的元素(HTML Element)。这种处理包括主动和被动两个方面,像《FAQ:如何访问WebBrowser的滚动条》、《FAQ:操纵下拉列表》、《FAQ:两种方法访问多层嵌套的frame》等
文章所演示的就是主动的处理。通常我们从Webbrowser获得一个Web文档接口(IHTMLDocumentx),从它出发便可访问到浏览器所包含
的一切HTML元素。而被动的处理则是在COM技术中称为Sink的技术,我更喜欢的说法是事件通知。当文档的下载进度发生变化时,我们可以获得
ProgressChange通知,当Webbrowser下载完HTML文档时,我们可以获得DocumentComplete的通知,而当链接被点
击,或图片被拖动时,我们如何获得通知呢?本文希望能够给出部分的答案。
2、HtmlObj Template
如何Sink一个HTML Element并不是本文的重点,其理论我不是太了解,也懒得去搞透彻,所以使用现成的库来实现。CodeProject上的一篇文章《CHtmlObj Template》给出的一个模板类CHtmlObj就非常好用。下面的例子是针对Html Anchor Element的一个实例化。
#include "HtmlObj.h"
class CHtmlAnchorElement : public CHtmlObj<IHTMLAnchorElement,
&DIID_HTMLAnchorEvents>
{
public:
CHtmlAnchorElement(CHtmlDocument2* pParentDoc2);
virtual ~CHtmlAnchorElement();
virtual HRESULT OnInvoke(DISPID dispidMember,REFIID riid,
LCID lcid, WORD wFlags,
DISPPARAMS * pdispparams, VARIANT * pvarResult,
EXCEPINFO * pexcepinfo,
UINT * puArgErr);
};
HRESULT CHtmlAnchorElement::OnInvoke(DISPID dispidMember,
REFIID riid, LCID lcid, WORD wFlags,
DISPPARAMS * pdispparams, VARIANT * pvarResult,
EXCEPINFO * pexcepinfo,
UINT * puArgErr)
{
HRESULT hr = E_NOTIMPL;
switch(dispidMember)
{
case DISPID_HTMLELEMENTEVENTS_ONMOUSEOVER :
{//当鼠标经过链接时,我们在这里获得通知
hr = S_OK;
// TODO: add code to handle on mouse over events
break;
}
case DISPID_HTMLELEMENTEVENTS_ONMOUSEOUT :
{//当鼠标从链接上移开时,我们在这里获得通知,其它的Dispatch ID可根据需要添加
hr = S_OK;
// TODO: add code to handle on mouse out events
break;
}
default:
{
break;
}
}
return hr;
}
当
我们得到某个链接的HTML接口指针,便可调用CHtmlAnchorElement继承自CHtmlObj的SetSite(IUnknown
*pUnkSite)成员函数传入该接口指针。在CHtmlObj类内部用一个智能指针m_spHtmlObj来保存相应的HTML
Element接口指针,所以当上面的ONMOUSEHOVER和ONMOUSEOUT两个事件通知到达时,从m_spHtmlObj就可以访问
IHTMLAnchorElement的所有成员,如从href获得链接的Url等,此处不再赘述。
3、CHtmlElements类
有
了CHtmlObj之后我们又会发现实践中常常会需要多个相同类型的CHtmlObj。比如包含Frame的网页中每个Frame的HTML
Document都需要一个CHtmlObj来Sink其事件。所以我们还需要有效地管理这些相同类型的CHtmlObj。下面是我写的一个简单的模板类
CHtmlElements,它通过CMap来管理多个CHtmlObj对象。
template<class THtmlElement> class CHtmlElements
{
typedef CMap<LPDISPATCH, LPDISPATCH, THtmlElement*, THtmlElement*> CMapDispToHtmlElement;
CMapDispToHtmlElement m_htmlElements;
BOOL IsSiteConnected( LPDISPATCH pDisp )
{
THtmlElement *pElement;
return m_htmlElements.Lookup( pDisp, pElement );
}
public :
CHtmlElements( void )
{
}
~CHtmlElements( void )
{
}
public :
void SetSite( LPDISPATCH pDisp )
{
if ( IsSiteConnected( pDisp ) ) //检查以避免多余的Sink
{
return ;
}
THtmlElement *pElement = new THtmlElement; //通过模板类型创建相应的类的实例进行连接
pElement->SetSite( pDisp );
m_htmlElements.SetAt( pDisp, pElement );
}
//在合适的地方调用Clear释放所管理的内存
void Clear(void)
{
POSITION pos = m_htmlElements.GetStartPosition();
THtmlElement *pElement = NULL;
LPDISPATCH pDisp = NULL;
while (pos != NULL)
{
m_htmlElements.GetNextAssoc( pos, pDisp, pElement );
m_htmlElements.RemoveKey( pDisp );
delete pElement;
}
}
};
假设我们有一个象CHtmlAnchorElement那样派生自CHtmlObj的类CHtmlDocument2,使用CHtmlElements时这样声明:
typedef CHtmlElements<CHtmlDocument2> CHtmlDocuments;
typedef CHtmlElements<CHtmlAnchorElement> CHtmlAnchors;
class CMyView : public CHtmlView
{
private :
CHtmlDocuments m_htmlDocs;
CHtmlAnchors m_htmlAnchors;
}
在DocumentComplete时就可以这样连接到浏览器的文档对象:
void CMyView ::OnDocumentComplete(LPDISPATCH pDisp, LPCTSTR lpszURL)
{
m_htmlDocs.SetSite(pDisp);
}
如
果想一次性连接上文档中所有的Anchor
Element,可以通过IHTMLDocument2::get_anchors获得包含所有IHTMLAnchorElement接口指针的
IHTMLElementCollection,再遍历其中的每个元素,分别调用m_htmlAnchors.SetSite即可。当然,一次性的
Sink全部链接可能并不是个好注意,我更愿意在CHtmlDocument2中响应事件再通过其它手段来访问当前位置的HTML Element。
4、结论
响
应HTML
Element的事件通知对于浏览器编程来说是一个非常强大的手段,它可以更深入细化地控制浏览器中的文档及其HTML元素,实现更为高级的功能,比如所
谓的“超级拖放”(许多多窗口浏览器都提供了该功能,但实际上没有哪个浏览器完美地实现了对URL、文字及图片的拖放)。
5、参考资料
Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=621961