|
|
| ミランコヴィッチメニューへ戻る 全体目次 教科書 気候学 Климатология 173頁 ロシア語 http://elib.rshu.ru/files_books/pdf/img-214143231.pdf 序-1 序-2 序-3 1-1 1-2 1-3 1-4 1-5 1-6 1-7 1-8 1-9 1-10 第1章 .気候学的処理の方法 47頁数式前まで ここで、N-一般的な観測の数e、s-。再現性と呼ばれるPCの数でのグラデーションの数とpk yavlyaets I2番目のistinnogI確率の値の評価。この評価とIyavlyaets @偏りがなく、効率的で、N-と一致していることを証明できます。*°°@ D l確率の明確な図は、計算された再現性のパーセンテージとして表されることがよくあります@泥と相対頻度は次の形式ですeテーブルの中で、ACCRの間隔の値として-。@場合によっては、分布特性は、各間隔の気象値の相対密度の侵入を計算します。 m番目を生成するための式の計算 この方法で計算された値は、次の形式で表すことができます ![]() 図1.3 気温分布ヒストグラム。 レニングラード。 7月21日。 横軸cに沿って、間隔Al *をレイオフし、それぞれに基づいて、高さが等しい長方形を作成しますv ^。結果として得られる階段状の曲線は、ヒストグラムと呼ばれます。ヒストグラムの各長方形の面積は、対応する頻度に等しくなります。図では1.3例として、レニングラードの気温分布のヒストグラムを示します。さまざまな間隔の頻度の値を知ることで、スラッジの経験分布関数と累積頻度を決定することができます。経験分布関数は通常、次の形式の関数として解釈されます。 ここで、d e n xは、確率変数Xがxのある値よりも小さいことが判明した場合の数です。 JV- + 0 0では、頻度は確率の真の値になる傾向があるため、経験的曲線Iも理論的分布に近づきます F(x)グラフは、増加する階段状の曲線y y(図1.4)であり、その縦座標は次の式で計算されます。 ![]() ![]() ここで、sはグラデーションの数、x、-、およびxi + 1は、グラデーションの気象値の極値です。 経験分布関数を作成する場合 場合によっては、経験分布関数の代わりに ヒストグラムと経験分布関数を作成するときは、グラデーションの正しいサイズを選択することが非常に重要です。グラデーション値が十分に小さい場合、サンプルサイズが限られているため、各間隔に分類される観測値はほとんどありません。この場合、ヒストグラムは複数の頂点であることがわかり、分布の本質的な特性を明確に反映していません。 また、グラデーションの数が非常に多いと、グループ化の意味がなくなります。一方、グラデーション数が少ないと、分布の特徴を特定することが困難になります。したがって、最適なグラデーション値を選択する必要があります。 この場合、明確な推奨を行うことは不可能です。 したがって、間隔の幅を決定するためのいくつかの経験則を簡単にリストし、この方向で実行された研究結果について簡単に説明します。 グラデーションの数を決定する最も簡単な方法の1つは、式を使用することです。 ここで、e 5はグラデーションの数、Nは処理される情報の量です。この場合、グラデーション数を推定するための唯一のパラメーターはサンプルサイズです。式(1.12)を使用して実行された数値実験は、信頼できる結果が非常に多数の観測でのみ得られることを示しています。 星座間隔のサイズを決定する別の方法は、それを0.5°に設定することです。つまり、気象値の変動が考慮されます。場合によっては、データの相対的なグループ化エラーも考慮されます。たとえば、グラデーションの数は、次の式を使用して決定できます。 この場合、グラデーション数を決定するためには、グループとデータの二乗平均平方根誤差と気象値自体の二乗平均平方根値を知る必要があります。たとえば、分布のエントロピーを計算するなど、最適な間隔を推定するためのより複雑な方法が他にもあります。この場合、エントロピーの最小値に対応する間隔が最適な間隔として選択されます。 1.3.3 主な気候指標の計算 気候学の研究と応用問題を解決するとき、ランダム過程のさまざまな数値特性も広まっています。これらの特性は、すでに述べたように、目的と必要な詳細に応じて、異なる平均化で考慮されます。気象パラメータ、特性と変動性、安定性、接続性、およびその他の気候指標の平均値は、分布の初期モーメントと中心モーメント(50番目)で表すことができます。 <?-次数の最初のモーメントの式は次の形式になります。 中心モーメントのために この場合、グラデーション数を決定するためには、グループとデータの二乗平均平方根誤差と気象値自体の二乗平均平方根値を知る必要があります。たとえば、分布のエントロピーを計算するなど、最適な間隔を推定するためのより複雑な方法が他にもあります。この場合、エントロピーの最小値に対応する間隔が最適な間隔として選択されます。 1.3.3 主な気候指標の計算気候学の研究と応用問題を解決するとき、ランダム過程のさまざまな数値特性も広まっています。これらの特性は、すでに述べたように、目的と必要な詳細に応じて、異なる平均化で考慮されます。 気象パラメータ、特性と変動性、安定性、接続性、およびその他の気候指標の平均値は、分布の初期モーメントと中心モーメント(50番目)で表すことができます。 <?-次数の最初のモーメントの式は次の形式になります。 ここで、рijは確率変数の同時発生確率です。 実際には、通常、最初の4次の1点モーメントと、相関モーメントと呼ばれる2次Qiの混合中心モーメントが使用されます。 平均値(x)、標準偏差(o)、非対称係数(A)、尖度(t)、および相関(r)の式は、次のように記述できます。 ![]() モーメントがグループ化された一連の誘拐から計算される場合、それらの評価は次の式を使用して行われます。 ![]() ここで、xはi年生の中間の確率変数の値です。pfはi年生の値xの出現の経験的確率です。 グループ化されたデータからモーメントを計算するときに発生する系統的誤差は、ほとんどの場合、高いほどグラデーション幅が大きくなります。 分布があまり歪んでいない場合は、いわゆるシェパード補正を導入することで、このエラーを考慮に入れることができます。 この場合、瞬間の式は次の形式になります。 ![]() ここに グラデーション幅の大きな値での補正を考慮せずに計算された歪度と尖度の係数は、補正で計算された値よりも正確であることに注意してください。これは、歪度と尖度の係数がモーメントの比率であり、グループ化から生じる誤差が互いに補償し合うという事実によるものです。式(1.21)によって決定される気候指標に加えて、他の指標が使用されます。数学的期待値を特徴付ける平均値に加えて、中央値と最頻値の2つの特徴が導入されています。中央値は方程式の根として定義できます。 求められる値x(この場合)は、経験分布曲線によって決定できます。 場合によっては、中央値に加えて、分布の分位数も決定されます。 次数qの分位数は方程式の根です」 ここで、qは指定された数です。 0 <q <1。したがって、中央値は、1/2または50%の分位数(カバレッジ)のオーダーの分位数です。 モードは確率変数хтであり、最大確率密度に対応します。 ファッションp ![]() 図1.5 分布法則の非対称性が異なる最頻値xt、中央値xd 5、および平均値xの相互配置 数学的期待値と最頻値の関係を図1に示します。 1.5 この図は、対称分布法則の場合、3つの量すべてが一致することを示しています。非対称分布では一致は見られません。モードaが中央値に先行する場合、非対称性は正であり、そうでない場合は負です。正の歪度では、分布曲線のほとんどがモードの右側にあるため、この歪度は右手系と呼ばれます。 非対称性の値は、<0.25で小さい、0.25 <*で中程度と見なされます。 A |«.0、5以上| A \> 0.50。位置特性(分布の最大値の位置を意味する)と呼ばれることもある平均、中央値、最頻値に加えて、いわゆる分散特性が気候指標として使用されます。後者には、平均二乗偏差と分散に加えて、絶対平均偏差と変動係数が含まれます。平均絶対偏差は、次の式によって決定されます。 変動係数は相対値であり、V =(1.22)は式eで定義されます。 54頁から 表 季節の中心月の気温の気候指標の選択された値 ![]() この量の使用は、空間内のさまざまなポイントまたはさまざまな期間について決定された標準偏差の比較が、空間内の量(降水量、風速)の大きな変化のために示されない場合に便利です。重要な気候指標は、エクスカーションの係数(またはピーク分布の特性)です。 正規曲線と比較してピークが大きい曲線は尖度が正であり、上部が浅い曲線は尖度が負です。尖度係数aは-2からo <*>まで変動します。 E = -2では、分布曲線は2つの別々の曲線に分割されます。例として、表で。 1.1は、2つのポイントの主な気候指標のサンプル値を示しています。 ここで、気候指標のサンプル推定の精度について詳しく見ていきましょう。 kの推定の精度は、サンプルサイズ、時系列の接続性の程度、および確率変数の分布の性質に依存します。ほとんどの場合、サンプルの算術平均値は式eによって計算されます。 独立した観測の場合、この推定値a54は偏りがなく、一貫性があり、効果的であることが示されます。 推定値の分散は、元のデータの量に反比例します。 接続されたサンプルに基づいて平均値を推定する場合、算術平均の平均二乗誤差は次の式で計算されます。 55頁、上から6行目の式から 公平で、裕福で、効率的です。 推定値の分散は、元のデータの量に反比例します。 接続されたサンプルに基づいて平均値を推定する場合、算術平均の平均二乗誤差は次の式で計算されます。 ![]() d eGu--シリーズの-iメンバーとjメンバー間の相関係数。 この式から、正の相関は推定の平均二乗誤差を増加させ、それによってその信頼性を低下させることがわかります。 したがって、独立したデータから信頼できる推定値を取得するには、必要な背景情報が少なくて済みます。 分散を推定するには、次の式を使用できます。 この見積もりも一貫して効果的ですが、偏りはありません。 この場合のオフセット値は Nの値が大きい場合、このシフトは小さく、無視できます。 小さなサンプルの場合、推定値(1.25)の1補正を実行し、それに値N /(N-1)を掛ける必要があります。この場合、推定値は次の形式になります。 彼女は裕福で偏見がないでしょう。 不偏推定の分散誤差を決定するには、次の式を使用できます。 ここに 観測における接続された系列の場合、式(1.27)は次の形式を取ります。 ![]() 式(1.28)から、時系列の値の相関により、平均値を計算する場合よりも必要な情報の量が少なくなることがわかります。時系列の相関関係は、他の気候指標に大きな影響を及ぼします。たとえば、テーブルで。 1.2は、HMSレニングラードでの1月の気温の観測から計算された、主要な気候指標の推定値と誤差を示しています。表に示されている結果は、接続性の欠如が気候特性の精度を大幅に上回っていることを示しています。気候指標の精度を判断するには、次の中心モーメントの誤差の式を使用できます。 表1.2 シリーズの接続性を考慮した統計的特性を決定する際の誤差の推定値と接続性を考慮せずに推定された誤差の比率(o1 / o0) ![]() これらのシリーズは、他の気候指標に大きな影響を与えます。 たとえば、テーブルで。 1.2は、HMSレニングラードでの1月の気温の観測から計算された、主要な気候指標の推定値と誤差を示しています。 表に示されている結果は、接続性の欠如が気候特性の精度を大幅に上回っていることを示しています。 の気候指標の精度を決定するには ![]() 分析された気象図の分布が正常であると仮定すると、(1.29)に基づいて、エラーの次の簡単な式が得られます。 ![]() 正規一般母集団から取得したサンプルの経験的データから相関係数を計算する場合、通常は次の式が使用されます。 この式aは、N> 50で相関係数の値が小さい(r <0.5)場合、56の大規模な一連の観測にのみ適用できると言わなければなりません。 小さいサンプル(N <50)の場合、相関係数の信頼性はR.フィッシャー変換を使用して推定されます。 ![]() Nが増加すると、この値は正規法則になりがちです。エラーを決定するための上記の方法は、単一の(ポイント)エラー値を計算することです。もう1つのより完全で信頼性の高い推定方法は、推定された気候指標の値が特定の信頼度で含まれる特定の間隔を決定することです。 気候指標の評価が存在し、気候指標の真の値が確率Pに含まれる長さの間隔(A-i、K2)は、信頼区間と呼ばれます。信頼区間を構築するには、対応する気候指標の分布法則を知る必要があります。大きなサンプル(N> 50)の場合、多くの気候指標には漸近正規性の特性があります。つまり、N- +°°の場合、それらの分布は正常になる傾向があります。この場合、必要な信頼区間は次の形式になります。 d e f0-気候指標の評価。 tqは、条件から決定される正規分布の分位数です。 qは、比率によって信頼水準Pに関連付けられた有意水準です。 ![]() 確率の積分。 ほとんどの場合、信頼水準は次のようになります。0.95または0.99(q = 5%aq = l%)。 この場合、iのtqの値はそれぞれ1.96と2.58です。 特に、平均、標準偏差、相関係数については、信頼度 ![]() 小さいサンプル(N <50)の場合、tq分位数は、平均の学生の法則と標準偏差のX2(カイ2乗)法則に従って、固定された有意水準で決定されます。 この場合、対応する信頼区間は次のとおりです。 ![]() g de tqはスチューデントの分布の分位数であり、q%の有意水準で特別な表に従って検出されます。 この場合のoの信頼区間は、分布X aの非対称性を考慮すると、非対称であることがわかります。 ![]() XiとX2の値は、分布表x 2-によって決定されます-この場合、X22は確率p = 0.5q / 100に対して求められ、x 2i-確率p = 1-0.5q /に対して求められます。 100。これらの量を決定するために、図に示すように、分布密度曲線x2を使用することもできます。 1.6 例として、表で。 1.3は、気温分布が正常に近いと仮定して得られた、2点の気温aのサンプル気候指標の標準誤差を示しています。これらのエラーを知っているので、対応する信頼区間を構築することは難しくありません。 小さなサンプルの相関係数を評価する場合、確率変数を使用して信頼区間を作成します ![]() 表1.3 サンプリングされた気候指標の標準誤差 ![]() 60頁の上段から 信頼区間を構築するために、ランダムな値が使用されます。 これは、Nが増加すると、推定値とr£yの分布よりもはるかに速く正規法則yになる傾向があります。 この場合、信頼区間は次のように計算されます。 ここで、0Z ^ 1 /(N-3)、tqは正規分布の分位数です。 式e(1.40)によって決定される値zは、いくつかの臨界値と比較されます。 z> z K pであることが判明した場合、与えられたo qに対して、相関係数aの計算値はゼロとは大きく異なります。テーブル1.4は、i推定値の信頼区間の上限と下限の値、および<7 = 5%での相関の係数を示しています。 1.3.4 理論法則による気象量の分布の近似多くの場合、実験的に得られたヒストグラムを、理論的な分布法則である適切な分析式で近似する必要があります。 この操作は、統計レベリングと呼ばれます。通常、近似は、調査対象の現象の物理的メカニズムに関する結論を取得するため、または後続の計算を実行するために実行されます。近似に進むと、まず、問題を解決する必要があります。 ![]() 離散分布と連続分布のどちらを使用するか。気候学的研究では、離散分布を使用したxは、さまざまな大気現象を特徴付けるヒストグラムを近似します。たとえば、霜、霧、吹雪の日数、夏の雷雨の数、無雨期間の長さなどです。 個々の気象量の分布は、通常、連続法則を使用して概算されます。実際には、原則として、4つの主要なタイプの分布法則が使用されます。単一頂点、U字型、およびJ字型、複数頂点です。ために。適切な分布則を選択するために、最初に、構築されたヒストグラムの性質とさまざまな理論的分布のグラフとの定性的な比較が行われます。 気候学的アプリケーションで最も一般的な分布は、単峰性の分布です。 1つの頂点の分布は対称および非対称であり、いくつかの負または正の非対称性があります。対称分布は、明確に定義された物理的限界を持たず、多数の累積的に作用する要因の影響下で形成される気象量の特徴です。 そのような気象量は、例えば、気温、大気圧、温帯の夏と冬の季節の水蒸気の分圧です。図の対称分布の例として。 1.3は、レニングラードにおける7月の気温分布のヒストグラムを示しています。 多くの場合、分布は対称的ではありません。分布の非対称性は、気象量のいくつかの値の出現を制限するいくつかの支配的な要因があることの証拠です。非対称分布の例は、我が国のさまざまな気候帯における気温分布の曲線です。 図では1.7は、モスクワとオイミャコンの1日の平均気温の分布を示しています。気象量の値が少なくとも片側で容易に達成可能な物理的限界を持っている場合、U字型とJ字型の外観を持つ分布が形成されます。 ![]() 図1.7 毎日の気温(G)の分布。 1月。 1-モスクワ、2-オイミャコン 例は雲の厚さの分布です。図に示すさまざまな形式です。 1.8。図から、前線(As-Ns)と積雲は薄い厚さの再発が少ないことがわかります。層積雲(Ac、Ss)の場合、0.5 km未満のグラデーションの頻度は80〜91%です。 急激に非対称な分布は、その値がゼロに制限されているため、たとえば風速の特徴です。図では1.9は、開発された高気圧で穏やかな状態がしばしば観察されるヤクートでの1月の風速の分布の例を示しています。 U字型の分布の典型的な例は雲の数であり、その値は0から10ポイントまで変化します。 U字型の分布は、地面から視覚的に観察される雲の量の毎日の緊急の値に典型的であることに注意する必要があります(図1.10)。 雲の観測が気象衛星を使用して実行される場合、分布のタイプは、雲量の程度が決定される領域の領域に依存します。したがって、分布の性質は、基本的に、気象量に関する情報がどのように取得されるかに依存します。 たとえば、テーブルで。 1.5は、さまざまな平均化領域の雲の数の頻度を計算した結果を示しています。雲量の評価が行われる地域が増えるにつれ、分布は徐々に単峰性に変化していることがはっきりとわかります。 63頁下4行未了 ![]() 図1.8 さまざまな形状の雲の厚さ(Dft)の分布。 1-ScおよびAc; 2-対流および正面(As-Ns)の雲。 ![]() イチジク。 1.9。 風速分布(v)。 ヤクート。 1月。 6 ![]() 図1.10 地上からの観測による量、雲(n)の分布。 ![]() イチジク。 1.11。 雲底分布(ft)。 極東。 夏。 表1.5 一年のさまざまな季節における雲の量の分布の経験的密度(R)。 ソ連のヨーロッパの部分、1979-1981 ![]() 国境x気候帯、モンスーン地域xなど。 KpMnip分布は、地理的ゾーンで観測された気象量の特徴であり、気候条件は、時間の経過とともに安定しているさまざまなプロセスの影響下で形成されます。 このような条件は、たとえば、観測されます。一方、2頂点分布の形成は、一連の観測、たとえば、日次および年次変動における周期的なx成分の存在によって影響を受けます。図では1.11は極東の雲の下部境界の分布曲線を示しています。 この66地域では、低曇りの形成は主にモンスーン発達のさまざまな段階での移流プロセスが原因で発生します。これは、2つの上部の分布を説明しています。マルチ頂点分布の解釈は、細心の注意を払って扱う必要があります。多頂点性は、分析された系列の統計的不均一性を示すことが非常に多いことに留意する必要があります。 この場合、最初にこの不均一性を排除するか、元のシリーズを2つ以上の部分に分割する必要があります。経験分布を近似するために、さまざまな理論則が使用されます。これらの法則の未知のパラメータを推定するための最も簡単な方法は、モーメント法です。その本質は次のとおりです。定性的な考慮事項に基づいて、sパラメータに応じて特定の理論的分布則p(x 、、μ、...、Xs)が選択されたとします。 パラメータは、理論分布の最初の最低モーメントを、式(1.18)または(1.19)によって決定された対応する統計モーメントと等しくすることによって決定されます。たとえば、分布の法則が2つのパラメーターによって決定される場合、これらのパラメーターは、理論上の分布の数学的期待値と分散を平均と分散の推定値に等しくすることによって決定できることがよくあります。多くの気象量の分布は、正規法則と一般正規法則によって近似できます。 ISTND£t。正規法則の確率は、数学的期待値と分散の2つのパラメーターによって決定されます。これは、分布曲線の形状がこれらのパラメーターに依存することを意味します。正規分布の確率密度は次の形式になります。 67頁 下4の式から 1-3へつづく |