【初码干货】使用阿里云开放搜索服务快速搭建资源搜索网站

大家好,我又来了,答应云栖论坛一周一篇文章, 由于工作太忙已中断1个多月实在抱歉,这一次写点轻松有趣的东西-快速的做个资源搜索站依稀记得十来年前,带宽还只有2M的时候,受各个论坛启发,做了可以搜索嘿嘿嘿资源的搜索站一晃这么多年过去,嘿嘿嘿的东西依然喜欢,但世间却变化万千资源种类已不仅仅是X片,高清电影、纪录片、无损音乐、美剧、大型软件等等,似乎更加吸引(GenialX:多样?资源呈现方式也百花齐放,从最早的BT文件、电驴地址,到现在的磁链地址、各种云盘等等而传统的P2P下载方式也变得格格不入,因为硬盘容量已经大到但凡大一点云存储服务商都把所有资源缓存在自己的服务器上,进行哈希匹配后直接提供离线下载资源(这也直接导致快播王欣被抓因此,作为资源的入口,电驴地址和磁链地址依然有着强大的生命力,受益于各商家庞大的离线存储,电驴、磁链地址已经近乎等同于直接的HTTP地址,并且有着比HTTP地址更... Read More

选举网站遭入侵美国指向俄罗斯

美国媒体29日披露的联邦调查局文件显示,美国两个州的选举系统网站可能遭黑客入侵。美国一些情报部门官员猜测,上述黑客攻击可能与俄罗斯等其他国家有关,意在“干涉美国总统选举”。黑客入侵警报联邦调查局网络安全部门本月18日就美国两个州选举系统相关网站遭黑客攻击发出紧急警报。根据美国多家媒体29日披露的警报内容,其中一个州的选举委员会网站受到“安全危害”,另一个州的选举系统遭遇“入侵尝试”。联邦调查局没有具体说明上述黑客入侵发生在哪两个州,但媒体依据多名“知情官员”的说法推测,这次警报涉及的可能是伊利诺伊州和亚利桑那州,因为这两个州不久前都发生过选举网站因黑客攻击暂时关闭的情况。按照亚利桑那州州务卿办公室发言人马特·罗伯茨的说法,联邦调查局6月告知该州政府官员,一名当地政府员工的电脑下载了恶意软件,导致其用于登录该州选举系统网站的密码等泄露,选民登记系统遭遇“严重威胁”。尽管调查人员没有发现选民数... Read More

教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神

本博文将带领你从入门到精通爬虫框架Scrapy,最终具备爬取任何网页的数据的能力。本文以校花网为例进行爬取,校花网:http://www.xiaohuar.com/,让你体验爬取校花的成就感。Scrapy,Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。Scratch,是抓取的意思,这个Python的爬虫框架叫Scrapy,大概也是这个意思吧,就叫它:小刮刮吧。Scrapy 使用了 Twisted异步网络库来处理网络通讯。整体架构大致如下Scrapy主要包括了以下组件引擎(Scrapy... Read More