file_get_contents和cURL性能比较

file_get_contents和cURL稳定性能比较分析


前面写那个爬图片的爬虫的时候,初期我用的是file_get_contents()函数来获取图片内容,跑了一次发现下载下来的图片很多都不完整,无法显示全.当时我考虑的是可能是因为网络波动导致超时.改了很多遍,比如增加超时的时间限制/重新执行.都不是很满意

我考虑的更大的因素是稳定性,能够稳定的获取一张完整的图片.因此暂时忽略这两个函数对url连接的速度分析.

PHP PHPQuery批量爬取图片

PHP PHPQuery批量爬取图片


最近在一个小众的网站上看漫画,然而这个网站实在是太过于坑爹.不使用异步加载技术,而是使用分页,一页只显示20张图片,而且因为网站比较小众,服务器网络环境比较乱,

加载图片实在是太慢,不能忍.于是一怒之下用PHP写了个抓图片的爬虫(懒癌驱动型编程)(毕竟PHP是最好的语言).

cURL

PHP的cURL扩展允许和各种服务器使用各种类型的协议进行连接和通讯.

此次需要爬取的网站并不需要登录,所以省去了cookie设置的一些麻烦.

Hello World

Hello World

折腾了2个小时,也算是把Blog搭起来了。很早之前就有这个想法,直到这个暑假才开始认真的去做,已经是懒癌晚期了。

在这之前已经把VPS,ss,centos还有LAMP一系列东西都配置好了,原打算blog用的是WordPress,都已经在本地配置好了,后来学长建议用Hexo,也顺便把荒废许久的github给捡起来。

看学长学姐们的blog已经写了不少了,而我才刚刚起步,也要努力。