在centos搭建网络爬虫与搜索引擎环境nutch2.3.1+mys...

点击: 309 次| 所属栏目:大数据, 网站建设| 暂无评论

nutch是Apache组织研发的一款开源的搜索引擎项目(网络爬虫),纯java实现,它提供了构建一个搜索引擎所需要的全部工具和功能。使用Nutch不仅可以建立自己内部网的搜索引擎,同时也可以针对整个网络建立搜索引擎。除...

解决采集图片下载失败的bug特发完美日志备忘

点击: 190 次| 所属栏目:网站建设| 暂无评论

……………………………………… Aug 07, 2016 11:12:35 AM org.apache.coyote.AbstractProtocol startINFO: Starting ProtocolHandle...

tomcat进程死掉自动重启的linux脚本

点击: 217 次| 所属栏目:网站建设| 暂无评论

对于tomcat搭建的网站,很多时候因为内存不足而死掉,为了监控进程自动重启,写如下 脚本: #!/bin/sh t=`date` COM="/usr/local/tomcat/tomcat/bi...

解决WordPress文章点击数(浏览量)随页面刷新而增加...

点击: 224 次| 所属栏目:网站建设| 解决WordPress文章点击数(浏览量)随页面刷新而增加的问题已关闭评论

网上存在大量关于WordPress文章点击数的脚本,大部分都一样,没有解决反刷新和过滤网络爬虫的问题,不具有真实意义,如果遇到恶意CC攻击,会对服务器造成极大压力特别是数据库。 下面提供一种基于cookie的解决方案:...

关于Discuz memcache/ssrf GETSHELL漏洞的...

点击: 286 次| 所属栏目:网站建设| 关于Discuz memcache/ssrf GETSHELL漏洞的修复方案已关闭评论

Discuz存在SSRF漏洞,在配置了memcache的情况下,攻击者可以利用ssrf通过memcache中转,向磁盘上写入WEBSHELL恶意代码,从而造成数据库泄漏。 解决办法: 找到论坛安装目录/source/...

搭建SVN服务器与Apache同步

点击: 356 次| 所属栏目:网站建设| 暂无评论

--检查内存 [root@imagehost bin]# free -m            ...

无程式不人生-使用Java实现网络资源定时抓取和图片...

点击: 372 次| 所属栏目:网站建设| 暂无评论

[2015-08-18 09:30:49,136] INFO [com.udast.collect.control.UdastConfigServlet.initUdast()] : ^抓取任务处理执行中……Aug 18...

Centos 6.5配置tomcat7.0.63APR运行库支持

点击: 249 次| 所属栏目:网站建设| 暂无评论

Tomcat是一个小型的轻量级应用服务器,也是JavaEE开发人员最常用的服务器之一。Tomcat Connector(Tomcat连接器)有bio、nio、apr三种运行模式,Tomcat的原生库基于Apache可移植...

apache url重定向相关规则设置

点击: 322 次| 所属栏目:网站建设| 暂无评论

如果网站调整了url重写规则,那么以前收录的帖子都将变成404,这时候需要做页面的一对一301转发规则,然后去站长平台设置改版规则,否则对seo极为不利。 设置页面规则如下: Rewirte主要的功能就是实现...