WordCloud — 词云

00x0 前言

上一篇其实还有一些微小的工作没做完,做完分词之后可以生成词云的。那什么是词云呢?词云又名文字云,是对文本数据中出现频率较高的关键字在视觉上的突出呈现,形成关键字的渲染形成类似云一样的彩色图片,从而可以一眼领略文本数据表达的意思。例如一下:

从技术上来说,词云是一种数据可视化方法,下面我们用python可以很简单的实现。

more >>


WebMagic – 炒鸡实用的Java爬虫框架

概述

WebMagic 的核心部分是一个精简的、模块化的爬虫实现,作者封装了大量的实用性功能。其中Spider是WebMagic内部流程的核心,它封装了爬虫的创建、启动、停止、多线程等功能。其实我们并不需要关注太多,大部分模块WebMagic都已经默认实现,我们只需要写Process部分。

如何使用

我们可以直接下载jar包放在我们的项目下就行了,下载地址 : https://github.com/code4craft/webmagic/releases/tag/webmagic-parent-0.6.1 这里只需要下载第一个文件,源代码没必要下载。

more >>


信息收集之 – TCP 空闲扫描

00x0 写在前面

今天安利的 TCP 空闲扫描是属于信息收集,在我刚刚入门 Web 安全的时候(可能现在还没入门,安全博大精深),对于信息收集其实是很忽略的,但是随着学习的不断深入,才发现信息收集是渗透测试及其重要的一个环节,也是黑阔区别于脚本小子很明显的一个特征。

more >>


Apache Struts2(S2-045) 漏洞

00x0 漏洞简介

Apache Struts 是美国阿帕奇软件基金会负责维护的一个开源项目,是一套用于创建企业级 Java Web 应用的开源 MVC 框架,主要提供两个版本框架产品:Struts 1 和 Struts 2。

ApacheStruts 2.3.5 -2.3.31 版本及 2.5-2.5.10 版本存在远程代码执行漏洞(CNNVD-201703-152,CVE-2017-5638)。该漏洞是由于上传功能的异常处理函数没有正确处理用户输入的错误信息。导致远程攻击者可以通过发送恶意的数据包,利用该漏洞在受影响的服务器上执行任意命令。

more >>


SQL注入实战一之 ASP + Access数据库注入

本文简述一下 SQL 注入的原理,同时手工实战一下,大牛请轻拍。

more >>

我们一直都向往,面朝大海,春暖花开。 但是几人能做到,心中有爱,四季不败?