WordCloud — 词云
00x0 前言
上一篇其实还有一些微小的工作没做完,做完分词之后可以生成词云的。那什么是词云呢?词云又名文字云,是对文本数据中出现频率较高的关键字在视觉上的突出呈现,形成关键字的渲染形成类似云一样的彩色图片,从而可以一眼领略文本数据表达的意思。例如一下:
从技术上来说,词云是一种数据可视化方法,下面我们用python可以很简单的实现。
现实告诉我: 保持好奇心,享受孤独
WebMagic 的核心部分是一个精简的、模块化的爬虫实现,作者封装了大量的实用性功能。其中Spider是WebMagic内部流程的核心,它封装了爬虫的创建、启动、停止、多线程等功能。其实我们并不需要关注太多,大部分模块WebMagic都已经默认实现,我们只需要写Process部分。
我们可以直接下载jar包放在我们的项目下就行了,下载地址 : https://github.com/code4craft/webmagic/releases/tag/webmagic-parent-0.6.1 这里只需要下载第一个文件,源代码没必要下载。
00x0 漏洞简介
Apache Struts 是美国阿帕奇软件基金会负责维护的一个开源项目,是一套用于创建企业级 Java Web 应用的开源 MVC 框架,主要提供两个版本框架产品:Struts 1 和 Struts 2。
ApacheStruts 2.3.5 -2.3.31 版本及 2.5-2.5.10 版本存在远程代码执行漏洞(CNNVD-201703-152,CVE-2017-5638)。该漏洞是由于上传功能的异常处理函数没有正确处理用户输入的错误信息。导致远程攻击者可以通过发送恶意的数据包,利用该漏洞在受影响的服务器上执行任意命令。