评分
1分享
评分
4分享

2023-09-09我们现在调研网站流量情况,使用的比较频繁的一个软件便是 Similarweb。比如可以使用这个网站来调研对方网站的月访问量、平均访问时长、跳出率、流量渠道,等等等。 有没有好奇 Similarweb 的数据是从哪里来的? 其实像这样的数据分析软件,使用的统计方式基本都是抽样分析,外加算法预测,只不过 Similarweb 的抽样量级比较恐怖。 Similarweb 每天会从全网各个渠道收集数以亿计的数据,然后进行算法建模。从而推导出各个网站的各类数据指标,及其数据变化趋势。 同时,Similarweb 也会接入数以万计的 GA 站长数据。而这个部分的数据则可以作为算法推导数据的对照组,用于矫正分析结果,对算法模型的数据进行补充。 所以从这个角度出发,Similarweb 的数据可以参考,但是不能迷信。

评分
2分享
评分
4分享
评分
3分享
评分
1分享
评分
5分享
评分
3分享

2020-12-11最近在群里还是会看到大家讨论节点的问题,这里分享一些我踩过的一些坑, 希望能帮到大家。 我之前不管是买的VVV还是自建,平时用whoer去查伪装度基本上都是100%的,但是吧,注册TK账号老是显示visit server too frequently这类的信息,一开始并未太在意,写个邮件去申诉然后tk就能让我注册了。 但后来发现这样的注册问题出现太频繁了,一开始以为是大选平台风控比较严格(当然可能还是有部分这个原因),后来才知道大概率是因为服务商和IP的原因。我测了一下,很多节点的IP真人率只有1%(可歌可泣),tk平台会判定是机器操作而非真人,所以注册才会跳出来各种问题。那么再这样的网络环境下,你的账号就算通过申诉最终可以注册了,但可能原始权重就会不太好,或者容易出各种问题,比如一开始几个视频流量还正常后面就突然没什么流量了。 那么什么是真人率呢? 这里简单科普下,互联网流量可分为两类,真人流量和无效流量,这就要提到一个名字-NHT,全称Non Human Traffic,中文名为非人类的访问,它可能是各种功能的机器人:搜索爬虫、内容采集器、舆情监控、网站性能监控、压力测试器、自动发帖机、安全检测软件等等。这就会让服务器管理人员感到困惑,到底哪个才是正常的访问? 当IP场景为“数据中心”时,此IP发出的网页浏览行为大多数情况下属于NHT(Non Human Traffic,非人类的访问),你懂的…这个时候这条IP很可能会被标记出来,在这个IP上的账号可能也会有异常。 那么我们又怎么知道我们的IP是否会被识别为NHT呢?这里没有一个非常确定的规则去判断,但可以通过RTBAsia提供的真人概率查询https://www.cz88.net/iplab, 或是ipip.net上面也有查询入口,真人率大于50%以上,比较安全。 所以大家在连接节点的时候,可以把那个节点的IP记下来然后先去查一下真人率怎么样,然后 选择一个真人率比较高的节点。 目前来讲,yoyo上面的美国节点有一些真人率还是比较高的,但很多小众国家节点真人率普遍在1%,不建议使用! 以上,希望能帮到大家!

评分
4分享
评分
3分享