“A hypothesis is a testable statement of the proposed relationship between the independent variable, which measures the cause, and the dependent variable, which measures the effect. “ (Pollock, 2015)
就是说,一个研究假设它一定是提出了一个可验证的关系的假设,这个关系里包含一个自变量和一个因变量, 这个研究假设需要提出了一个自变量是如何解释该因变量的。
仔细看这个定义我们能看出这么几层意思:
- 只讨论了一个变量的假设并不是研究假设。比如,“明天天气会变暖”—这里面只有一个变量,就是“天气”,它没有提出两个变量之间的关系,变暖这个事情是天气的特征值(value),而不是variable;
- 研究假设里面要提出自变量和因变量的关系,将自变量和因变量进行“联结”。比如,“明天天气会变暖,明天湿度会特别大”—-这里面确实出现了两个变量,然而并没有联结二者的关系,没有用自变量去解释因变量,所以也不是好的研究假设;
- 好的研究假设里不能只说两个东西相关,还要说他们是怎么相关的。—–比如随着一个变量的增长另一个也增长,这叫正相关;随着一个增长另一个下降,这叫负相关。
- 研究假设必须可以验证。比如,“喝咖啡越多头越疼”就可以验证;“喝咖啡越多人就越通灵”就无法验证 (至少现在科学界无法验证)。
研究假设的核心是解释“自变量与因变量的关系”
接下来我们再来好好说说IV 和DV这两个重量级大咖。
这里我请大家先从英文名字上来理解一下它们俩到底是干嘛的:
- Independent Variable : variable是变量的意思,independent是不依赖的意思,所以independent variable就是谁都不依赖的变量—-我自己变我自己的,不管别人变不变,其它变量决定不了我(很任性的)—-中文就叫“自变量”了, 其实直译过来就是“不依赖别人的变量”
- Dependent Variable: 再次顾名思义,它需要依赖,需要依赖什么呢?依赖其它变量来变化,否则它自己不知道该怎么变。那具体依赖谁呢?依赖“independent variable”的变化。Independent variable一变,dependent variable一定跟着变,因为它天生就需要依赖才能存在啊。—-中文里把它叫做了“因变量”,因着别的变量才知道自己是怎么变,然而英文名直译过来它应该叫“依赖别人的变量”吧?( 没让我去做翻译是有道理的系不系…)
【下文中为了书写方便,我会用IV(Independent Variable)代表自变量,DV(Dependent Variable) 代表因变量。】
在一个定量研究中,研究者核心的任务就是把至少一对儿“不依赖别人的变量”(IV) 和”依赖别人的变量” (DV )组合在一起,并且说明好它们之间的关系。而研究假设,也就是提炼后的、精确地描述这对儿IV-DV的未经检验的关系的陈述。
当IV和DV放在一起的时候, DV(因变量)是这个研究中被我们解释、被关注、被预测的东西,所以也它叫做“结果变量”(Outcome Variable);而IV则是导致了DV、能够解释DV、以及能够用来预测DV的东西,所以也叫“预测变量”或“解释变量”(Predictor Variable/ Explanatory Variable).
所以,一个更简单的对hypothesis的定义是:
“Hypothesis is a testable statement about the empirical relationship between cause (IV) and effect (DV). ”
在验证两个变量之间关系的时候,研究者总是试图通过改变和调试自变量(IV),来观测因变量(DV)的变化—–因为如果因变量随着自变量的变化而变化,那么就说明两者是相关的;至于是如何相关的,则需要进一步利用不同的统计模型来做出判断。
换句话来说:
- In experiments, the IV is the variable that is controlled and manipulated by the experimenter;
- whereas the DV is not manipulated, instead the DV is observed or measured for variation as a presumed result of the variation in the IV.
下图展示了研究假设中IV和DV的关系:
你可能会说,那有些东西不是由单独一个东西影响和决定的, 而是由多个东西决定的啊,比如人的学习成绩,由智商、情商、用功程度、学科基础、老师好坏等一系列因素组成,这怎么算?
那就是说学习成绩这个DV由很多个IV来解释,比如下图:
而在一个研究里,通常是不需要讨论到所有能够解释DV的IV的。(大多数的定量研究都是IV heavy型—–就是说我的研究的主要贡献在于我提出了一个前人可能没有注意到的IV,我如果把这个IV和这个因变量之间的关系证明好,我的文章就是有贡献的; 而另一类定量研究是DV heavy 型—这一类研究关注寻求某个DV(因变量)的完整解释模型,这就需要你尽量列出全部能够解释该DV的自变量。Again, 我们通常做的大多数研究是IV heavy型。 )
当我们写研究假设的时候,还应该注意到,每一个研究假设应该只讨论一对关系——也就是列出一个IV和一个DV之间的关系。 如果你在一个研究中准备探讨多个IV与DV的关系,那么你应该把每一对关系都分别列在一个单独的研究假设里,而不是把它们都列在一起。
OK, 说到这里,什么是好的研究假设就基本说完了。下面我们针对IV和DV这两位大咖做一个练习。
【自助练习题:请用类似上图的箭头和长方形方框画出下面研究假设中每一对IV和DV之间的关系图, IV在左,DV在右,箭头从IV指向DV】
- 假设1: 咖啡喝的越多,人越容易头痛。
- 假设2: 晴天的交通事故率小于阴天的交通事故率。
- 假设3:总是吃垃圾食品的人,更容易得心血管疾病。
- 假设4: 学历越高的人,玩电子游戏的能力越差。
以下是参考答案:
你可能已经发现了,一个好的研究假设不见得是一个正确的研究假设, 也就是说研究假设还没有验证(否则就不叫假设了),所以可能是对的也可能是错的,这要由数据来说话。数据结果如果没证实你的研究假设或者跟你假设的关系方向相反,也不代表你的研究就没有意义了。但是研究假设一定要可以验证,一定要说清楚了IV和DV的关系,论文中的研究假设当然还要make sense, 有理论支撑。
总结一下,这篇文章我们说明了什么是好的研究假设, 以及研究假设与自变量、因变量之间的关系。一个好的研究假设应该做到:
- 清楚说明一个自变量与一个因变量之间是有关联的;
- 清楚地说明自变量和因变量之间是怎样关联的(direction of relationship);
- 研究假设应该是可以验证的(testable).
而读别人文献的时候我们应该培养:
- 重视读懂实证文章里的研究假设;
- 从研究假设中能看得出谁是IV, 谁是DV,以及作者要验证怎样的关系;
- 脑中能勾画出研究假设中变量之间的关系图。
现在我们可以想一想,自己的研究,或者我们正在读的研究,它们的研究假设、自变量、因变量都分别是什么?研究假设是合格的研究假设吗?自变量和因变量的关系能不能清楚地画出来呢?
125jz网原创文章。发布者:江山如画,转载请注明出处:http://www.125jz.com/8901.html