欢迎光临
我们一直在努力

解决dom-crawler获取到乱码(编码)出错问题,GBK网页采集乱码

在使用dom-crawler出现得到结果是乱码的问题,无论怎么对结果进行处理,依然是乱码!
最终经过一番摸索,终于找到最佳解决方法。

通常情况下使用Crawler,addHtmlContent的方法定义如下,可以看默认编码格式的UTF-8,

public function addHtmlContent(string $content, string $charset = 'UTF-8')

我们一般直接使用以下代码实现,并未有指定编码格式,针对网页是UTF-8格式的不会出现异常,但针对其它编码格式的时候就可能会出现乱码的情况

$crawler = new Crawler();
$crawler->addHtmlContent($response);

因此,我们只需要进行如下书写即可,即添加编码格式

$crawler = new Crawler();
$crawler->addHtmlContent($response,'gbk');
赞(0)
版权归原作者所有,如有侵权请告知。达维营-前端网 » 解决dom-crawler获取到乱码(编码)出错问题,GBK网页采集乱码

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址