有关R语言的网络数据操作:
Rcurl包操作:
1)安装Rcurl ubuntu10.10
cmd:
install.packages(“RCurl”)
如果期间报错大致信息如下:
curl-config is not found in your path
curl-config and related devlopment libraries (libcurl) are not installed.
ERROR: configuration failed for package 'RCurl'
curl-config没有安装类似。。。使用apt-get install libcurl4-gnutls-dev
安装完毕。
library(bitops)
library(RCurl)
sina<-getUrl("http://www.sohu.com",encoding="utf-8")
Encoding(sina)
html <- readLines(con=textConnection(sina),encoding='utf8')
write.table(file="/tmp/f1.html',html)
利用RCurl包实现抓取。
R语言的base包socket通信