.NET/Clawler

.net 에 적합한 html parser

김모작자 2013. 5. 6. 11:27

java 용은 충분히 많으나

.net 에서 쓰기에 적합한건 제한적이다

다행히 open source 중 완성도가 높은게 있는데

 

1) HTML Agility Pack ( http://htmlagilitypack.codeplex.com/ )

2) HTML Tidy Managed ( https://github.com/markbeaton/TidyManaged )

 

추가로 WebKit 을 기반으로 한 HTML Browser Control 로는

WebKit.net ( http://webkitdotnet.sourceforge.net/ )

이 있다.

참고로 이 컨트롤을 사용할때 빌드된 webkit binary 를 같은 폴더에 복사해서 사용해야 한다

(컨트롤 초기화 시점에 발생하는 문제라면 이게 99%)