Jun
29
2009
我看到的最好的解决方案在 http://blog.sinzy.net/lamb/entry/14029
基本的思路是这样的:软雅黑五号字是的高度是18.012磅,而简体中文Word中A4纸张默认的设置是每页44行,每行15.85磅,这意味着在对齐网格的情况下, 一行的高度容不下一个微软雅黑五号字的高度:15.85<18.012,所以此时Word会计算15.85*2是否能排下,结果是可以的,即
18.52*2>18.012
此时Word就用两行来容纳一行的微软雅黑五号字。 因此五号的微软雅黑行距就会特别宽。只要在“页面设置”中调整每页行数,使得“跨度”大于18.012就可以了。

另外一个办法是用“小五”号的微软雅黑字体。
Jun
28
2009
剑桥麻省府,知遇念吾师。
学问富八斗,为人贵五辎。
劝勤需尽早,吃苦莫留迟。
娓娓书中玉,谆谆尤在斯。
Jun
23
2009
什么是熵?一直以来熵被定义为描述混乱程度的一种度量。
熵的定义和“热力学第二定理”有着千丝万缕的联系。 “Entropy is a relationship between macroscopic and microscopic quantities.”熵所描述的是宏观和微观量之间关系。
我们假定有一个封闭的充满空气的屋子,它的微观状态是指空气屋子里所有分子的位置和速度。由于数量巨大,我们通常难以把握全部的微观状态,而只能把握所谓宏观状态:例如屋子里空气的温度和密度。而对应着相同的温度和密度,可能有非常多不同的微观状态。
假定有一堵墙在屋子正中央,墙上有一个可以关闭的门,如果在某一个时刻门关上了,屋子里一边是真空(密度为零),另一边包含所有的屋子里的空气分子的概率是多少呢?两边“密度”和“温度”都很接近的概率又是多少呢?因为对应着“一边真空、一边充满所有分子”的微观状态的数目要远远低于对应着“两边密度和温度很接近”的的微观状态的数目,所以前者发生的概率极低,是极小概率事件,后者是大概率常态事件。
如果每个微观状态发生的概率相等,那么一个系统的热力学熵可以定义为这个系统全部微观状态总数N的对数
S = kB ln(N)
kB 称为波尔兹曼系数(Boltzmann's Constant)。 那么,为什么“熵”的定义里有一个取对数的过程呢?原因是对数使得热力学熵成为可加和的物理量。
例如我们有一个系统1有N1 个微观状态X = {x1 , ..., xN1 },另一个系统2有N2 个微观状态Y = {y1 , ..., yN2 }。那么它们合在一起的微观状态有几个呢?要描述新系统的微观状态,应该用一个组合变量 (X, Y)。它的可能取值共有N1*N2 个 。
系统1的熵 S1 = kB ln(N1)
系统2的熵 S2 = kB ln(N2)
联合系统的熵 S = kB ln(N1*N2 ) = kB ln(N1) + kB ln(N2) = S1 + S2
这就是熵的可加和性,熵定义中的对数只是为了方便地满足这个。
更一般地,如果对应着一个宏观的状态的每个微观状态i ,概率为Pi。那么,这个宏观状态对应的熵定义为

验证:当所有Pi 均相等为1/N时,上述S = k ln(N),即系统全部微观状态总数N的对数。
信息熵的概念由申农Claude E. Shannon 在1948年的论文 《A Mathematical Theory of Communication(通讯的数学原理)》中提出。

它用来描述当一个随机变量X 分别以概率{p(x1), ..., p(xn)}取得可能取值 {x1, ..., xn} 时,这个随机变量的“混乱程度”。
Jun
15
2009
关于正态分布的来历,找到几篇出处:
http://hi.baidu.com/hinus/blog/item/f7b21a7afeb51dee2e73b3cb.html
http://zxw.idm.cn/zcl/part3/C18a.htm
正态分布广泛适合观测误差等很多种场合,有一种观点是自然现象似乎都应当符合正态分布。正态分布可以从很多种假设出发推导出来,其中用最大信息熵原理配合标准方差为常数的约束条件推导出正态分布公式的思路比较简单。
一个连续变量的概率密度分布函数是f(x),那么这个函数的积分应当等于1,
(1)
如果该随机变量的标准方差为
(2)
如果一个随机变量仅仅受上面的条件约束,在这些约束下随机性最大,也就是变量对应的复杂程度或者说信息熵最大,即∫ -f(x) ln f(x) dx 应当最大。
利用拉哥朗日方法构造一个新函数F
F = ∫-f(x) ln f(x) dx + C1[∫f(x)dx-1] + C2[∫(x-a)2f(x)dx-σ2]
以上积分应当遍及变量x的一切可能值(从负无穷大积分到正无穷大)。复杂程度最大就是要求函数F对f的变分为零,有

我们得到
-ln f(x)-1+ C1+ C2(x-a)2=0
f(x)=exp(-1+ C1)exp[C2(x-a)2] (3)
利用关系(1)、(2)可以把(3)中的待定常数C1、 C2确定出来。借助定积分表,得到的分布函数就是正态分布公式
(4)
这样最大信息熵原理和标准方差为常数的限制就得到了正态分布函数公式(4)。换句话说对于确定的标准差σ2,随机变量可以有很多种分布函数,但是复杂程度最大(信息熵最大)的分布函数只能是正态分布。