问卷调查中敏感性问题调查方法探讨 内容摘要: 调查问卷中常常涉及到个人隐私或本人不愿正面回答的问题,对这类问题调查时采用通常使用的调查方法,不是无法调查就是难以获得真实结果,本文在分析敏感性问题的成因的基础上,具体从提问方式、调查方法与随机化回答技术三个方面详细阐述了在调查问卷中的敏感性问题如何设计,并提出设计敏感性问题应注意的问题。 关键词:敏感性问题调查;方法;探讨
敏感性问题给调查带来的后果 所谓的敏感性问题(sensitive question) 是指在一定时期或一定调查目的基础上为获取信息所提出的涉及被调查者秘密、禁忌等令其不愿回答或不愿真实回答的问题。例如:个人或单位是否有偷漏税行为?考生在考试中是否有作弊行为?是否为吸毒赌博人员?婚前是否有性行为?是否为同性恋及类似的为社会所不赞成的事件。 (一)敏感性问题导致抽样调查产生无回答现象 在调查中,由于调查项目的无回答或不真实回答等现象降低了数据的 量,使调查的精度大打折扣。引起抽样调查产生无回答现象的原因很多,但就被调查者来说经常会发生调查内容涉及敏感性问题而导致被调查对象有意识不回答或不真实回答的现象。 (二)敏感性问题导致调查结果不真实 学校的教学行政部门想以抽样调查的方式了解期终考试中作弊学生的比例有多大,如果直接询问"你是否在这次期终考试中作弊 "他们一定会作出否定的回答,因为作弊不仅是不光彩的事,而且违反了学校的考试纪律,如果作弊了如实回答,就会给回答者带来麻烦;即使有个别人敢于承认作弊的事实,但总的调查结果也会带来较大的偏差,使调查结果不真实,调查者不能获取真实结果。再如税务部门要了解个体户偷税的比例有多大,公安部门要了解吸毒的人数比例等等这些都是敏感性的问题,绝大多数的被调查者是不愿意如实回答调查者的。 (三)敏感性问题导致调查结果无法度量偏差 敏感性问题只所以具有敏感性,主要是由于这类问题涉及到个人(或单位)隐私、法律和道德行为规范等,一方面人们有对个人(或单位)隐私权保护的本能;另外,由于不遵守法律或道德规范,轻者会招来闲言非议或社会的不认可,重者甚至会受到法律的制裁。所以,如果回答者感到对这类问题的回答不能得到保密,就会失去了安全感,从而使他们对这些问题的回答变得“敏感”起来。他们往往会对这类问题拒绝回答,即使他们在不得已而必须做出回答时,也往往会掩盖自己的真实行为,即使做出了违反规范的行为,也常常会做出合乎社会规范要求的回答。这就导致了问卷调查结果无法度量偏差大小。但从研究者的角度出发,其调查的目的往往只是探求被调查样本所代表的总体中具有敏感性特征的个体在总体中的比例,而不在于获取样本中某具体个案是否具有敏感性特征。可见,回答者出于对问题敏感性的回避与研究者的调查目的并不冲突,这就保证了对敏感性问题的“去敏感化”技术在理论上是可行的。 要解决由于调查内容具有敏感性而导致的调查结果的“失真”现象,获得尽可能可靠的调查数据,就必须对敏感性问题进行“去敏感化”操作。所谓“去敏感化”并不是指以牺牲调查目的为代价,从调查研究中剔除敏感性问题。而是指在不“损伤”研究目的的前提下,借助技术手段,降低回答者对问题的敏感性,从而提高对问题的回答率和回答的真实性。对敏感性问题的“去敏感化”首先的思路是降低问题本身的敏感度。
二、提高问卷设计中的敏感性问题调查结果真实性对策探讨 为了得到敏感性问题的较为可靠的调查结果,需采取一些好的调查方法与问题的设计技术。下面将从提问方式(委婉询问法)、调查方法(网上敏感性问题调查法)与随机化回答技术三个方面来研究调查问卷中的敏感性问题设计: (一)委婉询问法 即注意敏感性问题的提问方式,在问卷中委婉地提出问题,这种方法采用不直截了当的文字语句进行询问,通过旁敲侧击来引出被访问者的实话,同时不给访问对象有泄露隐私的感觉。常用的方法有释疑法、转移法、假定法等。 1、释疑法。在问卷开头或敏感性问题之前可以加人一些说明性语言,说明调查机构与调查人员始终格守调查行业准则与职业道德,对被调查者的个人信息及所提供的数据资料将严格保密,以消除被调查者的心理防卫。如:对“在校大学生恋爱观及性观念调查”中可以在问卷开头说明:“您好,我们是xx调查公司的调查员。为了解目前在校大学生的恋爱观及性观念,我们征询您的看法。您的回答无所谓对错,只要是您真实的情况和看法即可。我们对您的回答将完全保密。可能要耽误您15分钟左右的时间,请您配合,谢谢您的合作。”释疑法在敏感性问题提出前声明这种行为或态度是较为平常或常见的,以拉近问卷与被调查者的距离,从而达到消除其心理防卫的目的。 2、转移法。即采用三人称方式提问,将本该被调查者根据自己实际情况回答的敏感性问题,转移到根据他人情况做答以降低敏感度。如:“许多人的信用卡都透支,您知道是什么原因吗?”采用转移法将被调查者的视角转移到其他信用卡持有者,消除自身的心理防卫从而获得有效的答案。 3、假定法。即用一个假定性条件句(假设某一情景或现象存在)作 为问题的前提,然后再询问应答者的看法。如:“如果您手上有10万元人民币,在购买汽车和住宅中您只能选择一种,您可能会选择何种?” (二)网上敏感性问题调查法 所谓网上敏感性问题调查,就是通过上网方式,按照随机原则抽取部分网员作样本进行敏感性问题调查,进而估计全部网员特征的调查方法。通过因特网进行敏感性问题调查,具备以下两点优势:第一是客观性。网上调查中的被调查者不用面对任何人,回答不真实的情况相应减少,使调查的可靠性大大提高。第二是保护性。敏感性问题的关键在于保护被调查者,通过调查方案设计,可以看出设计者处处为被调查者着想,使他们无后顾之忧。同时,网络两端的调查者与被调查者互不相识,也保护了被调查者的利益。 网上敏感性问题调查法的步骤:首先进行网上抽样。运用随机IP 自动拨叫技术来进行网上随机抽样。通过对一个随机IP发生软件设定IP码段取值范围来产生一批随机IP地址,再利用IP自动拨叫软件,向这些IP地址呼叫,并传送出信息。然后编制网上敏感性问题调查问卷。调查网页的首页是调查名称、目的及保密性介绍。网页的第二页为记录被调查者的有关情况,如工作、年龄、性别、身份证号码等等,根据调查目的不同具体确定需要记录的内容,并可作为抽样框的控制项,将不符合抽样范围的被调查者排除。第三页要随机抽取问题,利用随机函数与后面提到的随机提问及技术。最后分析调查结果。 (三)随机化回答技术 随机化回答是指在调查中使用特定的随机化装置,使得被调查者以预定的概率P来回答敏感性问题。这一技术的宗旨就是最大限度地为被调查者保守秘密,从取得被调查者的信任。随机化回答技术(Randomized Response Technique简记为RRT)有多种模型。由于这一技术能够最大限度地为被调查者保守秘密,所以,相对于直接回答调查,它更易于获得被调查者的信任和合作。 随机化选答技术的理论基础主要来源于三个模型:沃纳模型( Warner Model )、西蒙斯模型( Simmons Model )以及随机变量和模型。 1、基于沃纳模型( Warner Model )的相关问题随机化选答技术 沃纳模型(Warner model)。该模型是1965年由Wamer提出的, 其设计是向被调查者显示两个与敏感性问题(具有特征A)有关,但完全对立的问题,让被调查者按预定的概率从中选一个回答,调查者无权过问被调查者究竟回答的是哪一个问题,从而起到了为被调查者保密的效果。案例分析: 某教育机构研究大学生考试中的作弊程度,采用沃纳模型加以研究,设计了上述两种卡片60个装人一个盒子,盒子中有45张卡片写有“我在考试中作过弊”,剩余的卡片写有“我在考试中没有作过弊”,现抽取100名大学生,调查结果有28个人回答“是”,72人回答“不是”,试用95%的把握程度估计考试作弊人数比例的置信区间。 依题知n =100,= 28,p=75% t=1.96根据沃纳模型
所以,以95%的把握程度推断某市大学生考试作弊人数比例在0至23.6% (不能出现负值)。 沃纳的随机化回答模型有两个缺点:一是要求被调查者可能回答的两个问题存在相关关系,如上例中卡片A“我在考试中作弊”和卡片B “我在考试中没有作弊”是相互关联的两个问题,对此,被调查者仍有可能因怀疑而不予合作;二是两种卡片比例P不能各1/2,否则公式不成立。但是从消除被调查者顾虑的角度看,两种卡片最好各占1/2,这样抽中两类卡片的机会是均等的。一般来说,P的取值介于0.7-0.8之间较适宜,但也需要根据调查的敏感程度适当选取。若敏感程度较高则P应较小,反之亦然。P的选取一般最低不要低于0.6,最高不要高于0.85。 2、西蒙斯模M (Simmons model)。西蒙斯模型是 1967 年由西蒙斯( Simmons )提出的。其设计思想仍是基于沃纳的随机化选答的思想,只是在设计中,改用无关的问题 Y 代替了沃纳模型中的敏感性问题 A 的对立问题ā。通常选用与敏感性问题无关且容易获得的样本特点作为无关问题进行提问,如,生日、性别等。 基于西蒙斯模型的无关问题随机化选答技术设计如下:制作一个能产生两种实验结果的随机化装置,如两套外形一样的卡片,一套卡上写有敏感性问题“你属于 A 吗?”,另一套卡片上写有无关问题“你属于 Y 吗?”,其中 Y 是与 A 无关的非敏感性问题,如“你是四月份出生的吗?”、“你是上半年出生的吗?”、“你是男生吗?”等等。将两种卡片按预定的比例 p 混合后,放入一盒子中。调查时,被调查者只需从盒子中任意抽取一张卡片,根据卡片上的问题做出真实的回答。但调查者无权知道卡片上写的究竟是哪一个问题。 设抽样方式是简单随机有放回抽样,样本容量为 n , PA 为调查要探明的具有敏感性特征 A 的人在总体中所占的比例, PY 是具有无关特征 Y 的人在总体中所占的比例, p 是写有敏感性问题的卡片在所有卡片中所占的比例。假设所有回答者都对抽取到的问题做出回答且回答都是真实的。则被调查者回答“是”的可能有两种情形:被调查者抽取到敏感性问题( A )且具有敏感性特征(属于 A ),其概率为 · p ;被调查者抽取到无关问题( Y )且具有无关问题属性(属于 Y ),其概率为 ·( 1-p )。同样地,被调查者回答“否”的可能也有两种情形:被调查者抽取到敏感性问题( A )且不具有敏感性特征(不属于 A ),其概率为( 1- )· p ;被调查者抽取到无关问题( Y )且不具有无关问题特征(不属于 Y ),其概率为( 1- )·( 1-p )。即: ·( 1-p )。即: P (“是”) = · p +( 1-)·( 1-p ) ( 1 ) P (“否”) = ( 1- )· p + ·( 1-p ) ( 2 ) 而被调查总体中回答“是”和“否”的比例是可以通过回答结果计算的。设调查结果中有 个人回答“是”,则会有 n- 个人回答“否”。则: P (“是”) = /n = λ ( 3 ) P (“否”) = ( n- ) /n =1- λ ( 4 ) 由( 1 )与( 3 )或( 2 )与( 4 )可以推得: PA= [ λ - ( 1-p ) ]/ ( 2p-1 ) ( p ≠ 1/2 ) ( 5 ) = ( 1- ) /n + p ( 1-p ) / ( 2p-1 ) 2n ( 6 ) 式( 5 )中存在两个参数, p 可由调查者预先设定,λ则可以在调查后获得。 P (“是”) =· p + ·( 1-p ) ( 7 ) p (“否”) = ( 1- )· p +( 1- )·( 1-p ) ( 8 ) 而 P (“是”)、 P (“否”)仍可以通过( 3 )、( 4 )两式求得。则: = [ λ - ( 1-p ) ]/p ( p>0 ) ( 9 ) = λ( 1- λ) /( 10 ) 式( 9 )中存在三个参数, p 可由调查者预设,λ可以在调查后获得,而 PY 则要根据样本特点探求,如使用被调查者出生日期资料,可以获得样本中在某月出生的比例,或单月出生的比例,或某性别调查者在样本中的比例等。 3、对两种随机化选答技术的评价 随机化选答技术比传统的“去敏感化”技术更加具有保密性,因此也更容易获得被调查者的配合。因此适宜于调查敏感性程序很高的问题。但两种技术模型各有优缺点,也需要根据实际需要选用。相关问题随机化选答技术模型中,由于对每一个敏感性问题都可以从正反两个方面陈述,故不论回答者回答“是”或“否”,其他人均无法知晓他回答的是哪一个问题。而无关问题随机化选答技术模型中,则可以根据回答者是否具备无关问题的特征而推知其回答的是敏感性问题还是无关问题。如,若是已知被调查者不具备无关问题特征,则若其回答“是”,则可断定其回答的是敏感性问题;若是已知被调查者具备无关问题特征,则若其回答“否”,则同样可断定其回答的是敏感性问题。此时,如果肯定回答敏感性问题不符合社会规范,则前者会对被调查者构成威胁;与之相反,如果否定回答敏感性问题不符合社会规范,则后者会对被调查者构成威胁。可见,相关问题随机化选答技术模型具有更强的保密性。另外,相关问题随机化选答技术模型调查方案实施简便,不需另外组织调查 。 4、应用随机化回答技术应该注意的一些问题 对于敏感性问题的抽样调查和其它抽样调查是一样的,要求样本的数据必须真实,采用随机化回答技术的用意也在于使调查者和被调查者之间能增加合作以取得正确的数据,否则再好的方法也是没有用的,要做到这一点,有以下几点应该注意: (1) 要求使用这一方法的调查者应充分理解这种方法的特点。只有这样才能向被调查者解释清楚,使被调查者也充分理解这种方法,特别是让被调查者知道,他所回答的问题,别人是不知道的,因而可以消除顾虑,做到很好的配合和给以正确的回答。 (2) 对于随机化的设计应尽可能的简单,在让被调查人抽取卡片之前允许被调查者人检查这种设计方法和查阅卡片,使被调查相信这种设计没有做圈套骗人的内容,调查者可做示范性的试验,让被调查者真正了解如何应用这种设计来回答问题。 (3) 卡片上所提的问题必须简单明确,让被调查者知道问的是什么和应该怎样回答,要防止提问中的语法错误和多种理解。对所涉及的问题解释必须在抽问题之前进行,如问"你出生在五月 ",在抽取之前解释是公历还是阳历,就暴露了抽到的是哪一个问题,也就失去了随机化回答的意义。 (4)对于"无关的问题"应仔细选择,隐蔽性要强,使调查人员无从猜测被调查人对问题回答的答案。如"我是本地人",调查者能从口音上判断被调查者是不是本地人, "我的身份证号码的尾数是奇数",调查者能通过观察被调查者来判断其性别(因为我国的身份证号码的尾数奇数表示男性,偶数表示女性,并不是随机产生),这样就失去了无关问题本来应具有的保护作用。 总之,对敏感性问题设计研究的核心在于运用有效的方法消除被调查者的担忧与顾虑,达到提高调查数据质量的目的。关于敏感性问题的调查,应更注意对人们心理情况的研究,这启示我们可在统计理论中合心理学、社会学进行研究,力求产生更完美的随机化回答技术模型。
参考文献 [1]张伴洲.《敏感问题调查技术新探》[J] .统计研究, [2]柯惠新.丁立宏.《市场调查与分析》[M] .北京:2001(11) 中国统计出版社 [3]冯士雍.《抽样调查的理论与方法》[M].中国统计出版社 [4] 金勇进、蒋妍、李序颖.《抽样技术》[C].中国人民大学出版社编 [5] [澳]艾德?弗瑞斯特著,李进、杨哲慧、成栋译.《网上市场调查》[M].机械工业出版社 [6]风笑天.《社会调查中的问卷设计》[R].天津人民出版社 [7]郭强主编.《调查实战指南——网络调查手册》[C].中国时代经济出版社