python简易爬虫

这篇文章主要讲解 python如何实现简易爬虫

爬虫流程

打开种子url —-> 获取种子url页面中所有的url —-> 判断是否被爬取过,未爬取过的url添加到url列表中 —-> 解析页面中需要的信息 —-> 写入数据库

查看更多

Java 应用中的日志

这篇文章主要讲解 Java 应用中的日志

日志在应用程序中是非常非常重要的,好的日志信息能有助于我们在程序出现 BUG 时能快速进行定位,并能找出其中的原因。

但是,很多介绍 AOP 的地方都采用日志来作为介绍,实际上日志要采用切面的话是极其不科学的!对于日志来说,只是在方法开始、结束、异常时输出一些什么,那是绝对不够的,这样的日志对于日志分析没有任何意义。如果在方法的开始和结束整个日志,那方法中呢?如果方法中没有日志的话,那就完全失去了日志的意义!如果应用出现问题要查找由什么原因造成的,也没有什么作用。这样的日志还不如不用!

希望藉以本文能让应用程序的开发人员能更加重视日志,能在应用中输出有意义的日志。

查看更多

Java 启动参数

这篇文章主要讲解 Java 启动参数
在linux用jmeter做压力测试的时候,发现jmeter启动参数,记录一下:

java -server -XX:+HeapDumpOnOutOfMemoryError -Xms512m -Xmx512m -XX:+UseG1GC -XX:MaxGCPauseMillis=250 -XX:G1ReservePercent=20 -Djava.security.egd=file:/dev/urandom -jar xxxx.jar

解释一下上述参数意思:

查看更多