分散は色々
分散は、
母分散、
標本不偏分散、
母集団数(N)が標本集団数(n)に対して十分に大きくない場合の分散など
色々とあることに注意。
xは母集団の確率変数、Xは標本集団の確率変数
標本不偏分散を算出するときに、Xの偏差平方和を (n-1) で割る理由がよく話題になるが、
標本平均に対する偏差平方和の期待値をしっかりと計算すれば割る理由がよく分かる。
(n-1)で割れば、σ^2 に等しくなる。
感覚的な説明としては、
「偏差平方を計算するときに使用している平均値が、母平均ではなく、
標本集団自身の平均であり、偏差平方の値を低くみつもることになるため、
n で割るのではなく、自由度が 1 つへった (n-1) で割る」
といったあたりか...
この時、E(x) = u 、V(x) = σ^2 を使う
u は母平均、σ は母分散
増分バックアップと差分バックアップ
ブログ書きはじめにも関わらず、いきなり、
バックアップに関してのお話。
増分バックアップと差分バックアップの違いが分からなかったので調べてみた。
以下は、Windows OS に事例をあてはめた場合。
Windows では、任意のファイルをバックアップするかしないかの判定に、
アーカイブ・ビットと呼ばれる、おそらくは、2値の判定ビットをファイル情報に
付属させているみたい。
[増分バックアップ]
完全にバックアップがとれていた時点に対して、その後、変更があったファイルデータ
では、アーカイブ・ビットが有効化(バックアップするように指示がでている状態)
されている。バックアップは、アーカイブ・ビットが有効化されたデータが対象と
なる。無事にバックアップが済んだデータのアーカイブ・ビットは、無効化され、
更新済と認識される。
[差分バックアップ]
差分バックアップがバックアップ方法としてセットされた以前の最後のバックアップ
データを初期状態とする。
その後、変更があったファイルデータに対してアーカイブ・ビットが有効化され、
バックアップの都度、アーカイブ・ビットが有効化されているデータがバックアップ
される。
増分バックアップと異なる点は、バックアップ前に有効化されていたアーカイブ・
ビットが、バックアップを終えた後でも無効化されない点である。
そのため、またバックアップをした時に、再度、バックアップが行われる。
増分バックアップと比べて、差分バックアップは、差分バックアップを繰り返せば
繰り返すほど、バックアップする量が増えていく点に注意したい。