以下是摘自百度百科关于User Agent的相关描述:
User Agent中文名为用户代理,简称UA,它是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。 一些网站常常通过判断 UA 来给不同的操作系统、不同的浏览器发送不同的页面,因此可能造成某些页面无法在某个浏览器中正常显示,但通过伪装UA可以绕过检测。 浏览器的UA字串标准格式为: 浏览器标识 (操作系统标识; 加密等级标识; 浏览器语言) 渲染引擎标识 版本信息。
————————————————————————————
今天在使用file_get_contents抓取大众点评网上的数据时,结果出现HTTP request failed! HTTP/1.1 403 Forbidden 错误,最后在网上搜了下,定位问题出在user agent,PHP配置文件中默认user_agent的值为PHP,大众点评网通过判断请求的user_agent是否正常来识别是否来自于正常的访问请求。
解决办法:
在PHP程序中加上伪装的user_agent即可(推荐使用)。
ini_set('user_agent','Mozilla/5.0 (Windows NT 6.1; rv:14.0) Gecko/20100101 Firefox/14.0.2');
或者修改php.ini配置文件(不推荐使用)。
--------------------------------------------------------------------------------- 笔者水平有限,若有错漏,欢迎指正,如果转载以及CV操作,请务必注明出处,谢谢!
分类:
+加关注
0
0
上一篇: 下一篇:
posted @ 2012-09-01 20:09 阅读( 2112) 评论( 0)