2016年4月12日

[事实检查] 商业世界-SWS调查是否有效?算一下吧



一位读者问,“翁(Yung)最近的调查结果显示100%选民翁(Yung sinurvey)尼拉(Nung)。根据他们的报告,登记的选民有92%,无投票人有8%。 SWS为什么在调查中包括非投票人?”


读者指的是昨天4月10日发布的《商业世界-SWS调查》 [商业世界], 这表现了:



这是一个有效的问题,尤其是自从上任以来,SWS一直受到裙带关系指控的困扰,因为SWS总裁Mahar Mangahas恰好是Fernando PoeJr。’的第一个堂兄。就像我昨天说的一样’在帖子中,犯罪意图是’最好留给州检察官。相反,让’看一下数学,看看是否有’有点腥。

但首先,让我们引用SWS的调查方法:
2016年第一季度社会天气调查-于去年3月30日至4月2日,通过对全国1,500名成年人(其中1,377或92%的选民经过投票)进行面对面采访,并且抽样误差为±3分-杜特尔特先生的得分比坡女士高27%’s 23%, Mr. Binay’s 20% and Mr. Roxas’s 18%.
鉴于此,让’s提出以下问题:

  1. 这么小的样本量如何估计50+百万的意见?
  2. SWS为什么在样本中包括非投票人?
  3. 只有92%是注册选民,结果仍然可靠吗?
Pinoy认为,解决此问题的最佳方法是让您半步完成典型的调查过程。请注意,以下各节包括一些中学后数学,但是对高中代数有一定的了解就足以理解它们。
让’s go.

确定样本量


SWS希望估算全国选民的偏好:

  • 置信水平为95%,并且
  • 误差幅度为3%或0.03
在理想的世界中,实现此目标的最佳方法是采访所有5400万选民,但这是不切实际的。因此,我们只能采访一小部分人,并使用他们的答案进行统计推断。

也就是说,我们现在问一个问题:

准确评估5400万菲律宾人的意见所需的最低样本量是多少?

有两种解决方法,让我们从简单的方法开始。
和科克伦公式[科克伦1977]。

斯洛文公式


对于初学者,让’讨论以下两者中更简单(且使用更广泛)的方法:Slovin’slovin的公式[以色列,1992年].

斯洛文公式在这些假设下有效[特哈达2012]:
  • 期望的置信度为95%(正是SWS想要的)
  • 调查使用简单随机 抽样而无需更换(当然,每个选民在每个选举期间投票一次)
斯洛文的公式表示为:


哪里:
  • n是样本量
  • N是总人口,等于54,363,329 [拉普特]。
  • e是期望的误差容限,SWS将其设置为0.03。

插入N和e的值,我们得到:

也就是说,四舍五入,SWS需要采访至少1112个随机选择的注册选民。

科克伦公式


再严格一点数学也不会造成伤害。因此,我们不只是使用Slovin公式,而是使用其祖先,稍微复杂一点的Cochran公式[科克伦1977]。

科克伦公式表示为:

哪里:
  • n是样本量
  • z是z得分
  • p是人口比例
  • q预定义为(1-p)
  • e是误差余量
在继续之前,您可能已经注意到Cochran中的变量比Slovin中的变量更多,但是不用担心,我们可以简化一些事情。

为了消除q,我们可以只替换(1-p),即:



考虑表达式“ p(1- p)”。我们希望样本量尽可能地保守,也就是说,我们要确保n不会太小。由于p是未知的,因此我们可以简单地假设p的值为使“ p(1- p)”的值最大化的值,相对于“ p(1- p)”,n的值也将最大化。 ,因为n与后者成正比。

为此,我们假设p = 0.5,因此p(1- p)等于0.25。

任何高于或低于0.5的p值都会产生小于0.25的p(1-p)。

如果您想更严格一些,让我们使用一些基本的微积分。假设我们要最大化K,其中:

取K关于p的导数,我们得到:

为了找到使K最大化的p,我们将导数设置为0,即:



即,当p为0.5时,K最高。

继续,p = 0.5:

所以现在,我们剩下两个未知数的方程:z和e。

现在,e = 0.03(期望的误差容限)。同时,在95%置信水平下,z = 1.96 [耶鲁大学], 以便:

也就是说,通过科克伦公式和四舍五入,我们需要采访至少1068个随机选择的注册选民。

结论


从而, 如果1500名受访者中只有1377名或92%是注册选民,那就可以了, 只要SWS在其统计计算中未包括无效响应(未注册)。毕竟,有1,377个数字高于每个Slovin和Cochran的最低回答人数。


现在,读者可能想问一个问题:“为什么SWS首先将非投票者包括在内?”

答案很简单:因为没有实际的方法来验证受访者是否已注册。因此,当社会安全局随机选择1500人时,他们不知道他们是否是选民。基本上,c'est la vie。那就是生活。

就SWS调查背后的基本数学而言,Thinking Pinoy认为SWS调查是相当可信的,因为该方法与Pulse Asia,DZRH和Laylo等其他调查机构并没有真正的不同。

但是有一个陷阱


但是,Thinking Pinoy希望提出关于预设误差范围的问题。可以通过抽取更大的样本(即采访更多的受访者)来最大程度地减少错误的可能性。 
  • SWS是否出于财务约束或更糟,懒惰而将误差幅度设置为3%,或者
  • 3%的误差幅度是否是故意使引线看起来微不足道的尝试? 
毕竟3%的错误率意味着新的领跑者杜特尔特(拥有27%的票房)在统计上仍与拥有23%的坡(Poe)并列。

较大的误差幅度会增加统计联系的可能性。
该图像仅供参考,未按比例绘制。

现在,让我们将SWS的3%错误容限与其他产品进行对比:
  • DZRH使用了7,490名受访者,因此误差为+/- 1.13%
  • Laylo使用3,000名受访者,因此误差为+ / 1.8%

速帝世界总冠军大赛采访了多少受访者?少于1,500。
 
到12月下旬,铁托·马哈尔[TP:SWS调查]应该意识到,与之前的总统选举不同,这次选举可能是一场紧张的竞选。 Mahar比Think Pinoy聪明得多,因此可以肯定地说他已经知道了。

本着尽职调查的精神,Tito Mahar 应该努力完善SWS的方法以解决此问题。也就是说,他应该增加样本量以最小化误差范围。

但是铁托·马哈尔(Tito Mahar)没有。

SWS懒吗?
SWS破产了吗?
还是SWS真的偏爱某人?

____


你喜欢这个帖子吗?帮助ThinkingPinoy.com保持发展!甚至低至50比索也将有很大帮助!