188体育app官网_188体育投注

返回首页

CCF开放200T互联网网页历史数据

阅读量:175
2016-07-20

近日,中国计算机学会(CCF)获得北京大学网络实验室捐赠的近200T中国互联网网页历史数据(CWP200T)。为了更好地发挥这批数据的潜在研究价值,CCF决定开放该数据集,向有兴趣的研究机构和个人提供免费拷贝。

CWP200T包含在2002-2015年间公开存放在于中国互联网上的70多亿网页文本数据,涵盖上百万个网站,是开展网络大数据技术研究的极好素材。在当下大数据带来无限憧憬、社会呼唤数据开放共享之际,CCF希望借助此举彰显数据开放精神,以实际行动推动数据共享。

CCF欢迎对CWP200T有兴趣者提出数据拷贝申请,使用者需与CCF签署非商业、无侵害使用承诺书(点击下载),因拷贝工作将产生劳务成本,故使用者同时还需缴纳服务费用3000元。

详情请联系:宋广大,gdsong@ccf.org.cn

 

 图为演示网页历史数据提取过程

读完这篇文章后,您心情如何?