科学的灾难?-第7章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
为了使“份额”一词有意义,就必须使用补充项来分析结果;换言之,它的“解释模式”必须为加法模式。如果不是加法模式,那么这只能是个有缺陷的概念,而且这个错误概念会将思考引入歧途,构成一个真正的陷阱,这个陷阱本身则由于是一个无恶意、不自觉的陷阱而变得更具危险性。
“可支配能源”现象是煤炭和石油的出口或生产所导致的结果,至少在确定了两者的共同计算单位的范围内,这两种原因具有相加性,于是我们可以断定石油占x%的份额。同理,因为以法郎来计算住房和食品的开支,因此可以算出两者在总开支中各占多少份额。然而,这种可加性往往并不存在,那么问题也就没有意义。当遗传因子和环境因素分别是所涉及的两个原因时,问题显然就属于此类情况。我们前面提到的函数f除非在极特殊的情况下,否则不可能归结为加法并以C=I+A作为表达公式(其中I和A代表了那些只依赖于遗传因子或后天因素的项)。
无论如何,我们能够以一种看似微不足道实际上正相反的方式来改变这个问题,力求深入分析所研究的现象。假设这个现象的特征为参数C,我们不再研究各个原因在定值C中的份额,而是研究它们在C的变量值中所占的比例,符号△C代表C的变量值。
我们要当心一点:我们就这样由性状分析转变到性状差异的分析,因而极大地改变了研究的主旨,这不等于论述肝的消化作用或者不同个体的肝功能差异。前者所谈的那些每个个体都有的功能可能更为重要,至于后者则另当别论了。
严格地说,第二个问题和第一个问题一样,除了个别情况外,一般不具任何意义。不过,如果“原因”的变量△I和△A的值足够小,小到可以忽略不计那些次数大于2的项,并且如果函数C相当有规律,那么可以认同下面的近似计算公式:
△C =a△I+b△A
其中a和b代表变量I和A分别在变量C中所占的“比例”。
一个“性状” 取决于两个“参数”的简单例子,就是某个地点的海拔高度h,它随该地的经度L和纬度l而改变。参谋部的地图用等高线标明函数 h=f(L;l)。显然这是个复杂函数。
不过,假使这个地点很小,小到被视为地面等同于l的平面图,就可以列出下面的公式:
△h=a△L+b△l
公式中的a和b表示这个平面图的倾角。使用这个公式可以轻易地解决某些局部问题,这十分有效。但是,脱离了局部问题,这个公式就不再具有任何现实意义。
无论函数f多复杂,这个方法把C的演变简化为一个加法模式。虽然取得了辉煌的成功,但是不要忘记我们付出了怎样的代价:我们承认自己所比较的这些个体间的I和A的演变足够小,小到可以忽略不计它们的平方或者乘积。换言之,我们仅限于分析一个分类群的参数C 的演变,这个分类群的内部遗传性质大体相同(△I小)并且属于一个几乎没有变化的环境(△A小)。 因此,任何使用这个结论来比较那些基因型可能极为不同的分类群(△I大)或者属于不同环境(物理环境、社会学环境、教育环境)的分类群(△A大)都是与假设相悖的欺骗行为。
这不是关系式(1)的唯一特性。这个关系式还说明了论证某些观察或实验结果并开发其成果的好处。我们的公式易懂又实用,确保了它的成功,但是当我们提起它的严重缺陷时,我们可能会被视为难相处的人:这个公式只有局部意义。
一个如公式(1)般简单的模式,其吸引力是可以理解的,它给了人完美的智力享受。我们再回到童年时代的蓄水池和水龙头的老问题上,我们所研究的问题的性质类似于一个有着两处水源的水池:遗传学根源和环境根源,当水池的水位产生了x厘米的变化时,每个水源在这个变化中占有多少份额呢?应当承认,针对某些明确又必须有所限定的问题,这种技术可能有很强的实用性;但是由此得到的用途常常脱离常轨,反常到我们几乎无法在如此多的逻辑错误面前泰然地保持镇静。
事实上,一切都仿佛采用了与下面公式相符的一种说明模式:
△C =a△I+b△A
其次,在一些多少显得复杂但通常是正确的技术的帮助下,估算过参数a与b之后,我们得出了这些参数是C决定论的特有常数。然而a和 b 自身就是I与A的函数:它们与函数 f 的局部特性相符,却根本不符合那种联系C和I及A的未知机制的特有属性。
因此,那句常常被引用的著名话语:“智商变化的80%是基因型的演变,20%是出于环境的变化”,等于分别赋予系数80和20一个一般值,但是这两个数值只有在处于某种环境的某个个体分类群的特殊情况下才能最好地表现出来。
最后,涉及“先天和后天”的辩论的难点既不在于“先天”一词也不是“后天”这个术语,因为以某种随机性为条件,这个词语可以具有大家都接受的定义。难处来自于“和”一词,对于多数人来说,它令人联想到加法,而事实是它的基本含义是相互影响。
可惜,一个十分出名的数学算法 ,即分析方差,可以回答先天和后天的比例关系问题,但是使用者却不是总能完全清楚地意识到所得结论的意义上的有限性。对这个有时稍显难懂的方法的介绍隐藏了这样一个事实,即它所提供的答案并不具有含义,除非那个问题本身具有某种意义。
第二章 数的圈套方差分析及其圈套
联系参数及其各个“原因”的函数通常是未知函数,因此势必借助于一些间接方法,用决定△C的各因数的变化来“解释”△C的变化。所有习惯于进行统计计算的人都知道这就是方差分析的作用。方框1解释了什么是方差及方差的“分析”。
为了确切解释这个方法,我们将举一个非常简单的事例,但是我们在此热烈鼓励读者拿起笔,共同参与这个计算过程(只要会计算数字的平方就行了)。
性状的分布,方差和方差的分析
在一个有N名大学生的阶梯教室里,我们要求每个学生说出他们的身高:xi即学生i的身高。
计算这些学生的平均身高m的经典公式为:
m=x1+…+xi+…+xNN
还可以用更简单的公式m=∑N''i=1xi/N ,其中符号∑N''i=1的意思是所有指数i从i=1到i=N所构成的x个数的总和。
假设某两个阶梯教室的大学生们的平均身高m相等,那么其学生身高的分布很可能有显著的不同。这种分布的特性之一就是以平均值为中心的离散性。阶梯教室A的大多数学生的身高接近于平均身高,其离散差很小;另一个阶梯教室B里有一半学生的个头更高,另一半的个头较矮,其离散差的值就大。
我们可以设想一些测定这种离散差的不同方法,其中最经典的方法就是计算方差 V,即与平均值之间的间距的平方的平均值:
V=∑m''i=1(xi…m)2/N
假设所有的xi都接近m,那么方差值很小;假设一些值与m之间的距离大,那么该方差的数值就大。
一间只有男生或只有女生的阶梯教室,其方差通常要小于一个既有男生又有女生的阶梯教室,因为女生的平均身高mF 小于男生的平均身高mG;教室里的学生的性别不同,就导致了某种附加的离散差。
下面就是对总方差的分析,分为两个部分:
计算男生的方差和女生的方差的平均值,即教室内方差 (英语为variance within);
计算两组人即男生组和女生组的平均值的方差,也就是教室间方差(英语为variance between)。
我们通常可以证明:无论对这些个体进行分类的准则是什么(例如按性别、肤色分类,等等),总方差就是下面两个数字的总和:
各个不同类别的平均值的方差;
和各个不同类别的方差的平均值。
表述如下:
V=M(Vc)+V(Mc)
假设这些不同类别的平均值均相等,它们的方差为零,即V(Mc)=0;该性状的离散差完全取决于各个类别内部的离散差。
假设各个类别内部方差均为零,即M(Vc)=0,那么总离散差完全决定于各类别之间的间距。处于这两种极端情形之间的情况,我们可以用关系式V(Mc)/V来描述各个类别与性状的离散差之间的关系。方框1
首先,让我们思考一个性状,对该性状的测定只取决于个体的基因型和个体的生存环境。简单地说,我们假定某群体只有两个基因a1和a2,它们的出现频率相同,由此产生了3种基因型(a1a1)、(a1a2)和(a2a2),其频率分别为1/4、1/2和1/4。最后,这些个体中,半数生活于第一环境,即平原;半数在第二环境即山上生活。我们已经假定参数C是智力活动的某方面特性(例如,众所周知的“智商”,但是我们在此不作确切的说明,这样可以暂时避免任何有关该参数含义的争论),因此,假设参数C的测定与下表相吻合:在环境I中,两个基因的同时出现使C值增大,而环境II中的基因 a2 使得参数C的值持续增大。这幅非常直观的简图与我们在疟疾环境或非疟疾环境下,对那些导致某些血红蛋白反常现象的基因的观察结果相近。
基因型→
环境↓a1a1a1a2a2a2
I10014060II7090110
群体的性状平均值等于100因为个体总数的1/8生存于环境I 中并具有基因型a1a1,2/8生存于环境II中,其基因型为a1a2,等等,由此得出:m=1/8×100+2/8×140+1/8×60+1/8×70+2/8×90+1/8×110=100。,通过方差计算出以该平均值为中心的离散差,此处为V=750同理,根据定义来看,方差为:V=1/8(100…100)2+2/8(140…100)2+1/8(60…100)2+1/8(70…100)2+2/8(90…100)2+1/8(110…100)2=750。。这个方差起因于下列两个原因:
并非所有个体都具有相同的基因型;
并非所有个体都生存于相同的环境之中。
为了估计遗传影响所产生的总方差的比例,只需将生存在同一环境中的个体集中到一起并计算该分类群的参数C的方差VG。既然环境对该分类群的所有个体起着相同的作用,那么VG就代表了基因作用下的离散差,由此得出:
环境I中,VG1=1100因为环境I中的平均值为:mI
=1/4×100+1/2×140+1/4×60=110,方差为VI=1/4(100…110)2+1/2(140…110)
2+1/4(60…110)2=1100。
环境II中,VG2=200
等于说,如果这些个体各有一半分别生活于两个环境中,那么平均算起来,VG=(1100+200)/2=650。
换言之,根据这个计算,基因就是造成总方差等于650/750=87%的部分原因;通过差额计算,可以估计环境所占比例为13%。