対数最小二乗法

今回は最小2乗法についてうさぎでもわかるように、仕組みをわかりやすく説明しました。次回の第3章では、普通のグラフではなく、片対数、両対数グラフによるプロット; 片対数、両対数グラフを用いた最小2乗法; について説明しています。 ab指数回帰. 実験結果等の様々な誤差を含む点列データは通常折れ線グラフでは描かず、そのまま点を散布図で示すか、適切にカーブフィットした直線、または曲線で近似する手法をよくとります。ここではPythonで代表的な最小二乗法による直線近似を行う方法を紹介しま … 最小二乗法（または、最小自乗法）とは、誤差を伴う測定値の処理において、その誤差の二乗の和を最小にすることで、最も確からしい関係式を求める方法です。このページの続きでは、直線回帰の場合を例に最小二乗法の意味と計算方法を、図を用いながら分かりやすく説明しています。このページは「高校数学Ⅱ」の単元一覧です。こちらから解説の見たい単元に進みましょう。教科書より詳しい高校数学「よりくわ」の公式Line@アカウントです。キーワードを入力するとサイトのURLや公式の画像などを検索できますので、友達登録よろしく ããæ¨ªè»¸ãè¢«é¨èã®æ¤ç¥ããã©ã¼ãã³ã¹ãç¸¦è»¸ã«ã¨ãã¨ãä¾ãã°ä»¥ä¸ã®ããã«ãªãã¾ãã ããã â¦ 1 最小二乗法① 数学的性質経済統計分析（2013年度秋学期）（参考資料） 2 回帰分析と最小二乗法被説明変数y tの動きを説明変数x tの動きで説明＝回帰分析説明変数が1つ ⇒ 単回帰説明変数が2つ以上 ⇒ 重回帰説明できない部分が小さくなるように回帰式の … 線形方程式を定義ブログを報告する. ®é)ï¼Î±xx(éåº¦)ï¼Î²ï¼ã«ãããÎ±ã¨Î²ãè¦ã¤ããå¿è¦ãããã¾ãã 最小2乗法，最尤法線形モデル，非線形モデル ... があり，注意が必要である．逆に，対数変換することにより，等分散も成立するという場合も少なくない．ロジスティック回帰分析のモデルは， ô= 1 1+exp(Ä(å 0 +å 1x)) (0.1) である．これをロジット変換すると z =ln í ô 1Äô ì å 0 +å 1x (0.2 Excelã«ããã¦ãä»»æã®å¾ãã«å¯¾ãã¦ãããã¤ãã®ãã¼ã¿ï¼x,yï¼ãå¾ãå ´åãæå°2ä¹æ³ã§ãåçãç®åºããæ¹æ³ãæãã¦ããã ããªãã§ããããï¼ä¾ãã°ãé¢æ°y=mx+bã®å¾ãmï¼-0.5ã¨ããå ´å â¦ 乗法は、有理数、実数、複素数に対しても拡張定義される。また、抽象代数学においては、一般に可換とは限らない二項演算に対して、それを乗法、積などと呼称する（演算が可換である場合はしばしば加法、和などと呼ぶ）。 æå°äºä¹æ³ã®æé . フィッティングさせたい数式を決定 (例では y = Ax + B) 二乗和の式を展開; 各係数で偏微分; 連立方程式を解いて係数の値を決定; 導出例. そこで、今回は実験やデータの分析でよく使う「最小二乗法」についてうさぎでもわかるように説明します！, 中学生のときに抵抗を求める関係式\[I = \frac{V}{R}\]を習いましたね。, （ \( I \) は電流[A]、\( V \) は電圧[V]、\( R \) は抵抗[Ω]です。）, もしかしたら\[V = IR\]と（Vには愛があーる）とおぼえてる人もいるかもしれません。, では、この関係式\[V = IR\]を \( I \) の関数 \( V = f(I) \) として考えてみましょう。, ちなみに \( I \) の関数というのは、\( I \) に何かしらの値を代入すると、それに対応した値が帰ってくる箱みたいなものです。, 今回は抵抗 \( R \) を 2[Ω]としてみましょうか。すると、\[V = 2I\]という式が成り立ちますね。, 例えば、\( I = 0.5 \) とすると、\( V = 1.0 \) となり、\( I = 3.0 \) とすると \( V = 6.0 \) となりますね*1。, ということで、オームの法則（理論値）と実世界の値はどれくらい異なるのかをここからとある方法を使ってみていきましょう。, 随分前のレポートなのですが、未だにパソコンに残っているとは思いませんでしたよほんとに。, 線を引けば、だいたいの傾きがわかりますね。この傾きが \( R \) に相当します。, この「だいたいの点を通るけど、どうやって線を引けばどの点にも近くなるんだろう…」というのを数学的に求めるのが最小2乗法の仕組みです。, ある実験により得られたデータがを独立変数、を従属変数としての関数として関係式\[y = ax + b\]を満たしていると予想できているとします*2。, このとき、, の個の測定値の組をそれぞれとし、これらの方程式からつぎの方程式\[y_i = a x_i + b\]における係数 , の最確値を求めることを考えてみましょう。, 測定の組で生じた誤差（測定の不確かさ）をとすると、つぎの式（誤差方程式といいます）\[r_i = y_i - a x_i - b\]が成立します。, （ここでのは実際に得た値、は計算によって得た値なので測定値と理論値の差が誤差となります。）, この誤差ができるだけ小さくなる（誤差が0に近づく）との値を求めればOKと言い換えられます。, 実際は \( n\) 個すべてのデータに対して適用するので、\[\sum^n_{i = 1} r_i\]が0に近づくときのとの値を求めればいいことになります。, そのため、正の誤差と負の誤差が打ち消しあって、誤差がありまくりなのに0になる、というわけが分からないことがおこります。, そこで、誤差 \( r_i \) を2乗したものを全部足していくことにしましょう。, （実は、分散を求めるときも偏差を2乗するのですが、まったく同じ理由で2乗を行っています。）, すると、式は\[\sum^n_{i = 1} r_i^2\]となりますね。この式が0に最も近くなる \( a \), \( b \) を求めるのが最小2乗法です。, （2変数関数というのは、2つの変数 \( a \), \( b \) を入れると値が1つ決まる魔法の箱です。）, （停留点は解析学で習うと思います。「停留点ってなんだ？」と思った人のようなまだ習っていない人はこちらの記事で復習お願いします。）, さて、では停留点を求めていきましょう。\( S \) は \( a \) と \( b \) の関数ですので \( S \) を \( a , b \)それぞれについて「偏微分」しましょう。, 実際に計算すると、\[\begin{align*}S(a,b) = & \sum^n_{i = 1} r_i^2 \\ = & \sum^n_{i = 1} \left( y_i - a x_i - b \right)^2\\ = &\sum^n_{i = 1} \left( y_i^2 + a^2 x_i^2 +b^2 - 2a x_i y_i - 2b y_i + 2ab x_i \right)\end{align*}\]ですので、\[\begin{align*}\frac{\partial S}{\partial a} = & \sum^n_{i = 1} \frac{\partial}{\partial a} \left( y_i^2 + a^2 x_i^2 +b^2 - 2a x_i y_i - 2b y_i + 2ab x_i \right)\\ = & \sum^n_{i = 1} \left( 2ax_i^2 - 2x_i y_i + 2 b x_i \right)\end{align*}\]\[\begin{align*}\frac{\partial S}{\partial b} = & \sum^n_{i = 1} \frac{\partial}{\partial b} \left( y_i^2 + a^2 x_i^2 +b^2 - 2a x_i y_i - 2b y_i + 2ab x_i \right)\\ = & \sum^n_{i = 1} \left( 2b - 2 y_i + 2a x_i \right)\end{align*}\]となっていますから、このとき\[\frac{\partial S}{\partial a} = 0, \ \ \ \frac{\partial S}{\partial b} = 0\]ですので、\[\begin{align*} &\sum^n_{i = 1} \left( 2ax_i^2 - 2x_i y_i + 2 b x_i \right)\\ = & \ 2 \sum^n_{i = 1} \left( ax_i^2 - x_i y_i + b x_i \right)\\ = & \ 2 \left( a \sum^n_{i = 1} x_i^2 - \sum^n_{i = 1} x_i y_i + b \sum^n_{i = 1} x_i \right) = 0\end{align*} \]\[\begin{align*} &\sum^n_{i = 1} \left( 2b - 2 y_i + 2a x_i \right)\\ = & \ 2 \sum^n_{i = 1} \left( b - y_i + a x_i \right)\\ = & \ 2 \left( b \sum^n_{i = 1} 1 - \sum^n_{i = 1} y_i + a \sum^n_{i = 1} x_i \right) = 0\end{align*} \]となり、\[a \sum^n_{i = 1} x_i^2 - \sum^n_{i = 1} x_i y_i + b \sum^n_{i = 1} x_i = 0 \\bn - \sum^n_{i = 1} y_i + a \sum^n_{i = 1} x_i = 0\]という2つの関係式が出てきました。*3, シグマが多くてごちゃごちゃするので、シグマを別の記号 [ ] をつかって\[\sum^n_{i = 1} x_i y_i = [xy]\]のように書いて式を整理しましょう。, 先ほどの2つの関係式は\[a [ x^2] - [xy] + b [x] = 0 , \ \ \ \ a[x] - [y] + nb = 0\]という見た目だけは簡単な式になりますね。, この2式はただの連立1次方程式なので、これを解くことで , の値を求めることができます！, 実際に解いてみると、\[a = \frac{n [xy] - [x][y]}{n [x^2] - [x]^2} , \ \ \ \ b = \frac{[x^2][y] - [x][xy]}{n [x^2] - [x]^2} \]と求めることができます。, この式の \( a \) の部分を \( R \)、\( b \) の部分を \( V_0 \) にすると、最小2乗法が適用できますね。, （ \( y\) の部分は \( V \)、\( x \) の部分は \( R \) となります。）, 実際に、最初に出した実験データから最小2乗法を使って抵抗 \( R \) と起電力 \( V_0 \) を求めましょう。, ここで、最小2乗法の式のが電流、が電圧に対応付けができるので、具体的に\[R = \frac{n [IV] - [I][V]}{n [I^2] - [I]^2} , \ \ \ \ V_0 = \frac{[I^2][V] - [I][IV]}{n [I^2] - [I]^2} \]となりますね。, 計算はめんどくさいと思うので手でせず、Excelやら電卓でやることをおすすめします。, ただし、Excelで行う場合は有効数字の処理に気を付けましょう。（round関数などできちんと有効数字の処理しましょう。）, 実際に求めると、\[\begin{align*}[I] & = \sum^{n}_{i = 1} x_i \\ & = 10.562\end{align*}\]\[\begin{align*}[V] & = \sum^{n}_{i = 1} y_i \\ & = 21.003\end{align*}\]\[\begin{align*}[IV] & = \sum^{n}_{i = 1} x_i y_i \\ & = 45.786\end{align*}\]\[\begin{align*}[I^2] & = \sum^{n}_{i = 1} x_i^2 \\ & = 23.029\end{align*}\]\[\begin{align*}[I]^2 & = (10.562)^2 \\ & = 111.556\end{align*}\], あとは、実際に求めた値を代入し、 \( R \) と \( V_0 \) を求めると、, \[R = 1.987, \ \ \ V_0 = 0.001774\]と求まり、直線の傾き \( R \) および切片 \( V_0 \) を求めることができます。, このように、実際の値かどうかはわからないが、表向きに言われている値のことを公称値とよびます*4。, 2[Ω]だといわれている抵抗に対して、1.987[Ω] (相対誤差約1%) の結果が出せたのはなかなかな精度だと思います。, 最小2乗法は、線形なもの（直線なもの）適用できないと思われがちですが、実は何個か式を挟むことで、線形以外なものにも適用することができます。, 例えば、\[y = \frac{a}{x} + b\]というような反比例の式があるとします。, この式を、\[X = \frac{1}{x} , \ \ \ \ Y = y\]とおくことで、\[Y = aX + b\]という1次式に変形できますね。この形は、まさに最小2乗法ですね。, もう1つ比熱の式で例を出しましょう。比熱の式は、\[C = \gamma T + A T^3\]なのですが、この式の両辺をで割ると、\[\frac{C}{T} = \gamma + AT^2\]となりますね（ただし \( T \not = 0 \) を仮定することに注意）。, さらに、\[X = T^2 , \ \ \ \ Y = \frac{C}{T}\]とおくことで\[Y = AX + \gamma\]という最小2乗法の形になりますね。, 先ほど紹介した最小2乗法の式\[a = \frac{n [xy] - [x][y]}{n [x^2] - [x]^2} = \frac{ n \sum^n_{i = 1} x_i y_i - \sum^n_{i = 1} x_i \sum^n_{i = 1} y_i }{ n \sum^n_{i = 1} x_i^2 - \left( \sum^n_{i = 1} x_i \right)^2 }\\ b = \frac{[x^2][y] - [x][xy]}{n [x^2] - [x]^2} = \frac{ \sum^n_{i = 1} x_i^2 \sum^n_{i = 1} y_i - \sum^n_{i = 1} (x_i y_i) \sum^n_{i = 1} x_i }{ n \sum^n_{i = 1} x_i^2 - \left( \sum^n_{i = 1} x_i \right)^2 }\]の形はかなり複雑ですよね。, 手計算をするのは言うまでもなく嫌だし、Excelなどで計算させるのもかなり式入力がめんどくさいですよね。, 共分散は、ある番目（）データにおける平均のずれ（の残差）と別のデータにおける平均からのずれ（の残差）の積の平均を表します。式で書くと、\[\frac{1}{n} \sum^n_{i = 1} (x_i - \overline{x})(y_i - \overline{y})\]と表せます。, この式を変形すると、\[\begin{align*} &\frac{1}{n} \sum^n_{i = 1} \left( x_i y_i - x_i \overline{y} - y_i \overline{x} + \overline{x} \cdot \overline{y} \right)\\ = & \overline{x_i y_i} - \overline{y} \cdot \frac{1}{n} \sum^n_{i = 1} x_i - \overline{x} \cdot\frac{1}{n} \sum^n_{i = 1} y_i + \frac{1}{n} \cdot n \overline{x} \cdot \overline{y} \\ = & \overline{x_i y_i} - \overline{y} \cdot \overline{x} - \overline{x} \cdot \overline{y} + \overline{x} \cdot \overline{y}\\ = & \overline{x_i y_i} - \overline{x} \cdot \overline{y}\end{align*} \]となり、2つの積の平均 - それぞれの平均の積からも共分散を出せることがわかりましたね。, では、実際に共分散を使って式を変形してみましょう。式変形がめんどくさいので基本的には結果だけわかればOKです。, , はそれぞれの平均、の平均、はの分散\[\sigma_x^2 = \frac{1}{n} \sum^n_{i = 1} x_i^2 - \left( \frac{1}{n} \sum^n_{i = 1} x_i \right)^2\]を表しています。, \[ \begin{align*}a & = \frac{ n \sum^n_{i = 1} (x_i y_i) - \sum^n_{i = 1} x_i \sum^n_{i = 1} y_i }{ n \sum^n_{i = 1} x_i^2 - \left( \sum^n_{i = 1} x_i \right)^2 }\\ & = \frac{ \frac{1}{n^2} \left( n \sum^n_{i = 1} x_i y_i - \sum^n_{i = 1} x_i \sum^n_{i = 1} y_i \right) }{ \frac{1}{n^2} \left( n \sum^n_{i = 1} x_i^2 - \left( \sum^n_{i = 1} x_i \right)^2 \right) }\\ & = \frac{ \frac{1}{n} \sum^n_{i = 1} (x_i y_i) - \frac{1}{n} \sum^n_{i = 1} x_i \cdot\frac{1}{n} \sum^n_{i = 1} y_i }{ \frac{1}{n} \sum^n_{i = 1} x_i^2 - \left( \frac{1}{n} \sum^n_{i = 1} x_i \right)^2 }\\ & = \frac{ \overline{x y} - \overline{x} \cdot \overline{y} }{ \sigma_x^2 }\\ & = \frac{ s_{xy} }{ \sigma_x^2 }\end{align*} \]となり、は , の共分散およびの分散を用いて\[a =\frac{ s_{xy} }{ \sigma_x^2 }\]で求めることができますね！, 同様にも\[\begin{align*}b & = \frac{ \sum^n_{i = 1} x_i^2 \sum^n_{i = 1} y_i - \sum^n_{i = 1} (x_i y_i) \sum^n_{i = 1} x_i }{ n \sum^n_{i = 1} x_i^2 - \left( \sum^n_{i = 1} x_i \right)^2 }\\ & = \frac{ \frac{1}{n^2} \left( \sum^n_{i = 1} x_i^2 \sum^n_{i = 1} y_i - \sum^n_{i = 1} (x_i y_i) \sum^n_{i = 1} x_i \right) }{ \frac{1}{n^2} \left( n \sum^n_{i = 1} x_i^2 - \left( \sum^n_{i = 1} x_i \right)^2 \right) }\\ & = \frac{ \frac{1}{n^2} \sum^n_{i = 1} x_i^2 \sum^n_{i = 1} y_i - \frac{1}{n^2} \sum^n_{i = 1} (x_i y_i) \sum^n_{i = 1} x_i }{ \frac{1}{n} \sum^n_{i = 1} x_i^2 - \left( \frac{1}{n} \sum^n_{i = 1} x_i \right)^2 }\\ & = \frac{ \frac{1}{n^2} \sum^n_{i = 1} x_i^2 \sum^n_{i = 1} y_i - \frac{1}{n^2} \sum^n_{i = 1} (x_i y_i) \sum^n_{i = 1} x_i }{ \sigma_x^2 }\end{align*} \]となる。, ここから先は分子のみの変形を考える。\[\begin{align*} &\frac{1}{n^2} \sum^n_{i = 1} x_i^2 \sum^n_{i = 1} y_i - \frac{1}{n^2} \sum^n_{i = 1} (x_i y_i) \sum^n_{i = 1} x_i\\ = & \frac{1}{n^2} \sum^n_{i = 1} x_i^2 \sum^n_{i = 1} y_i - \frac{1}{n^2} \sum^n_{i = 1} (x_i y_i) \sum^n_{i = 1} x_i + ( \overline{x} )^2 \overline{y} - ( \overline{x} )^2 \overline{y}\\ = & \frac{1}{n^2} \sum^n_{i = 1} x_i^2 \sum^n_{i = 1} y_i - \frac{1}{n} \sum^n_{i = 1} (x_i y_i) \cdot \sum^n_{i = 1} x_i + \frac{1}{n} \sum^n_{i = 1} x_i \cdot \overline{x} \cdot \overline{y} - \frac{1}{n^3} \sum^n_{i = 1} x_i \sum^n_{i = 1} x_i \sum^n_{i = 1} y_i\\ = & \frac{1}{n^2} \sum^n_{i = 1} x_i^2 \sum^n_{i = 1} y_i - \frac{1}{n^3} \sum^n_{i = 1} x_i \sum^n_{i = 1} x_i \sum^n_{i = 1} y_i - \frac{1}{n} \sum^n_{i = 1} (x_i y_i) \cdot \frac{1}{n} \sum^n_{i = 1} x_i + \frac{1}{n} \sum^n_{i = 1} x_i \cdot \overline{x} \cdot \overline{y} \\ = & \frac{1}{n} \sum^n_{i = 1} y_i \left( \sum^n_{i = 1} x_i^2 - \left( \sum^n_{i = 1} x_i \right)^2 \right) - \frac{1}{n} \sum^n_{i = 1} x_i \left( \frac{1}{n}\sum^n_{i = 1} (x_i y_i) -\overline{x} \cdot \overline{y} \right)\\ = & \overline{y} \sigma_x^2 - \overline{x} \left( \overline{xy} - \overline{x} \cdot \overline{y} \right)\\ = & \overline{y} \sigma_x^2 - \overline{x} s_{xy}\end{align*} \]となる。, よって、\[\begin{align*} &\frac{ \frac{1}{n^2} \sum^n_{i = 1} x_i^2 \sum^n_{i = 1} y_i - \frac{1}{n^2} \sum^n_{i = 1} (x_i y_i) \sum^n_{i = 1} x_i }{ \sigma_x^2 }\\ = & \frac{ \overline{y} \sigma_x^2 - \overline{x} s_{xy} }{ \sigma_{x}^2 }\\ = & \overline{y} -\overline{x} \cdot \frac{s_{xy}}{\sigma_x^2}\\ = & \overline{y} - a \overline{x} \ \left( \because a = \frac{ s_{xy} }{ \sigma_x^2 } \right)\end{align*} \]となる。, 参考文献：「Black学科へようこそ！　自然科学のための数学　最小2乗法」　（2019年9月29日アクセス）, 2つの測定の組で生じた誤差（測定の不確かさ）をとし、誤差方程式\[r_i = y_i - a x_i - b\]のの2乗の総和\[\sum^{n}_{i = 1} r^2\]が最小になるような , を、\[a = \frac{ s_{xy} }{ \sigma_x^2 }\\ b = \overline{y} - a \overline{x}\]と取ることで回帰直線を求めることができる。, ※ , はそれぞれ , の平均、はの分散、は , の共分散を表します。, 実際に第3章で計算したデータと同じ電圧と電流で正しい値がでるかを調べてみましょう。, すると、\[s_{xy} = 2.013 \\\sigma_{x}^2 = 1.013\]なので、\[a = R = \frac{s_{xy}}{\sigma_{x}^2} = 1.987\]となります[有効数字4桁]。, 同様にも求めます。の平均との平均はそれぞれ、\[\overline{x} = 1.509 \\\overline{y} = 3.000\]なので、\[\begin{align*}b & = V_0 \\ & = \overline{y} - a \overline{x} \\ & = 3.000 - 1.509 \times 1.987\\ & = 0.001774\end{align*} \]となります。, （ちなみにExcelでは共分散は covar 関数、分散は var.p 関数を使ってラクラク計算することができます！）, まずは、データを入力してください。今回は上の例で挙げた電流と電圧から抵抗と起電力を求めます。, なお、電流の値は [mA] など単位がずれていた場合に直してから入力してください。, つぎに入力したデータをすべて選択し、上側にある「おすすめグラフ」をクリックします。, すると、右側に「近似直線の書式設定」ウィンドウが出てくるので、線形近似であることを確認してから「グラフに数式を表示する」をクリックしてください。, 今回の場合は \[ y = 19.961x + 0.0005\] なので , となることがわかります。, そこからカテゴリを「数値」もしくは「指数」を選んでください。（指数を選ぶとの形で表示されます。）, ※万が一この表示になっていない場合、この画像にある棒グラフのアイコンをクリックすると出てくるはずです。, ※ Eは10の何乗かを表しています。例えば E-04 であれば、E+01であればを表しています。, 今回は最小2乗法についてうさぎでもわかるように、仕組みをわかりやすく説明しました。, *1:有効数字2桁を意識するため、わざと \( V = 1.0 \) と .0 を残しています。, *2: ののように、自身の値が変化する以外に値の変わりようがない変数を独立変数、のように、独立変数であるの値が変化することで自身の値が変化するような変数を従属変数といいます。, *3:シグマと微分演算子は有限の和であればいつでも順番を変えることができます。つまり、が有限の値であれば\[\frac{d}{dx} \sum^n_{i = 1} S(x) = \sum^n_{i = 1} \frac{d}{dx} S(x)\]は常に成立します。, *4:例えばですが、ジュースとかで「内容量 500mL」とか書かれていますね。この 500mLというのは、表向きに（パッケージなどで）言われている値で、実際に 500mL入っているかはわかりませんね。測ったら499mLかもしれませんし501mLくらいあるかもしれません。, 数学と情報が得意な大学生です。数学科目と情報科目をわかりやすく説明するブログを作っています！, 有効数字2桁を意識するため、わざと \( V = 1.0 \) と .0 を残しています。, 例えばですが、ジュースとかで「内容量 500mL」とか書かれていますね。この 500mLというのは、表向きに（パッケージなどで）言われている値で、実際に 500mL入っているかはわかりませんね。測ったら499mLかもしれませんし501mLくらいあるかもしれません。, \( [I]^2 \) は \( [I] \) を2乗したもの、\( [ I^2 ] \) は各電流の値を2乗したものの総和と、互いに異なっているものを求めていること, \( [IV] \) は、\( [I] \times [V] \) ではなく、各データの電流値と電圧値をかけたものの総和であること. ®ã®2ä¹ã®åè¨)ãæå°ã¨ãªãä¿æ°ãæ¢ç´¢ãã¾ãã ãã®æ©è½ã¯ã¨ã¯ã»ã«ã®ã½ã«ãã¼æ©è½ã¨å®å¨ã«ä¸è´ãã¾ãã å¾®åããããªãã¯ã¹è¨ç®ãªã©ã®é«çæ°å¦ãç¨ãã¦ãæå°äºä¹æ³ãæ´»ç¨ããã®ãä¸è¬çã§ãã とあるウェアラブルデバイス開発時にセンサの測定値に誤差が乗ってしまう問題がありました。色々調べているとその誤差は「人の歩く速度」によって大きさが変わることが分かったので、歩く速度を変えて誤差の大きさを測定しました。その結果が下のグラフです。（縦軸：誤差量、横軸：速度）, 性別や体重、年齢の違う人たちに同じように歩いてもらいました。その結果誤差は「性別や体重、年齢には依存せず、速度にほぼ比例する」という特性を掴みました。つまり以下のように誤差を直線として表すことができます。, この直線の方程式（Y(誤差量)＝αｘX(速度)＋β）を見つけることで誤差量を算出できるようになるため、下記式で誤差を取り除いた真の値（に近い値）を知れるようになります。, さて、ではこのαとβはどう求めるのでしょうか？今日はその方法をできるだけ分かりやすく説明したいと思います。, 多くのデータの振る舞いとよく似た直線を求めたいので、上図の【期待する直線】が求めたい近似直線となります。, さて連立方程式の場合、選んだ２点によって赤破線や青破線のように期待しない直線となってしまうことがあります。よって連立方程式で近似直線を求めるのは不適切となります。, 今回の目的は、人の歩く速度によって乗る誤差がどの程度か推測するために、誤差を式で表すことです。そのために（Y(誤差量)＝αｘX(速度)＋β）におけるαとβを見つける必要があります。このようなケースではデータの近傍を繋ぐ補間方法である最小二乗法が有効です。, さてではY(誤差量)＝αX(速度)＋βにｘ１〜ｘ４とｙ１〜ｙ４を代入してみましょう。, 上記４つの関係を満たすαとβは・・・４点が厳密に同一直線上にいない限り、残念ながら存在しません。あれ、このままではαとβは解が無いとなってしまいます。それは困る。そこで新たに真値との「誤差」を用意しましょう。, 先ほどの式を書きなおすと下記になります。ε（イプシロン）が真値との誤差を表しています。, ε１〜ε４が最小になるαとβを見つけることで、良い近似直線を見つけることができます。, 特定のεではなく、εの合計が最小となるものを見つけなければなりません。しかしεは正負どちらもありえるため単純に加算すると誤った結果を得てしまうことがあります。, ４つの誤差が　０．１、０．２、０．１、０．３の場合和は０．７　どっちが誤差が小さいか？, =∑( Yi^2 −2Yi(αXi ＋β)+(αXi)^2 ＋2αβXi ＋ β^2)・・・⑤, 突然ですが、∑(ε^2) ≧０なので当然式⑤も０以上となります。これを利用して式⑤を最小とするα、βを求めることができるのです。, さて式⑤　∑( Yi^2 −2Yi(αXi ＋β)+(αXi)^2 ＋2αβXi ＋ β^2)　は複雑に見えますね。でも求めたいα、βに着目すると、式⑤はα^2とβ^2を含んだ２次関数としてみることができます。常に０以上の２次関数ということはつまり下図のような「下に凸」として考えることができます。, ２次関数における最小値を求める方法は微分が一般的です。微分によって接線の傾きを求め、傾き＝０の点が最小となります。, 式⑤は変数としてα、βの２つを持っています。このような関数の微分は偏微分という大学で習う微分を用いる必要があります。偏微分？！まぁ身構えず気楽に行きましょう。, ∑( Yi^2 −2Yi(αXi ＋β)+(αXi)^2 ＋2αβXi ＋ β^2)をαで偏微分すると, ∑( Yi^2 −2Yi(αXi ＋β)+(αXi)^2 ＋2αβXi ＋ β^2)をβで偏微分すると, うん。なんとか★１と★２を求められました。この２つを頑張ってα、βについて解くと、最小二乗法 - Wikipediaの下記公式を導出できます。, 誤差量は人の歩く速度に比例して大きくなり、停止している場合（速度＝０）は理論的には誤差量も０になるはずなんです。, このようにX=０のときYも０になるようなデータの場合、β＝０、つまり切片０として近似直線を求めたいことがあるのです。, この場合は式★１（α＝∑( XiYi − βXi ) / （∑Xi^2））のβに０を代入し, みなさんご存知のように、近似直線はエクセルの機能で求められます。なので中々理論に立ち返る機会は少なく、私はすぐ忘れてしまいます・・・。理解の助けになれば幸いです。, public2015さんは、はてなブログを使っています。あなたもはてなブログをはじめてみませんか？, Powered by Hatena Blog 回帰分析(統合) 回帰推定値(統合) 回帰分析(グラフ統合) 計算コラム . 一般論をお聞きしたいのですが、どんな関数に従うか(理論的に)わからないデータがあったとします。その場合にどんな関数を用いて最小2乗法を行うのが良いのかお尋ねしたいのです。非常に狭い範囲においては一次関数に従うでしょうから、1 æå°2ä¹æ³ã«ããæ¨å®ã¯åãã£ã¦ãï¼æå°¤æ³ã«ããæ¨å®ãååã«çè§£ãã¦ä½¿ã£ã¦ããäººã¯ å°ãªãï¼ æå°¤æ³ãçè§£ããããã«ã¯ï¼ã¾ãï¼ç¢ºçã¨å°¤åº¦ã®éããææ¡ããªããã°ãªããªãï¼ e指数回帰. | 1 æå°äºä¹æ³â æ°å¦çæ§è³ª çµæ¸çµ±è¨åæ ï¼2013å¹´åº¦ç§å¦æï¼ ï¼åèè³æï¼ 2 åå¸°åæã¨æå°äºä¹æ³ è¢«èª¬æå¤æ°y tã®åããèª¬æå¤æ°x tã®åãã§èª¬æï¼åå¸°åæ èª¬æå¤æ°ã1ã¤ â ååå¸° èª¬æå¤æ°ã2ã¤ä»¥ä¸ â éåå¸° èª¬æã§ããªãé¨åãå°ãããªãããã«åå¸°å¼ã®ä¿æ° 最小二乗法は目的関数(誤差の2乗の合計)が最小となる係数を探索します。この機能はエクセルのソルバー機能と完全に一致します。微分やマトリックス計算などの高等数学を用いて、最小二乗法を活用するのが一般的です。 Linux Mint 13 Maya (64bit) ã§ã®ä½æ¥ãæ³å®ã g++ (Ubuntu/Linaro 4.6.3-1ubuntu5) 4.6.3; 1. æå°äºä¹æ³ã«ã¤ãã¦ もしχ2 >χ2 0 ならば、λを10倍し、3.に戻ってやり直す 6. å®é¨ãã¼ã¿ããã°ã©ããåºãã¦ãã®ã°ã©ãããå¼ãå°ãåºãããã®ã§ããè¦å½ãã¤ãã¾ããããæ¹æ³ããã£ããæãã¦ä¸ããå¤åå¯¾æ°ã®å¼ã«ãªãã¨æãããã°ã©ããªã®ã§å¯¾æ°ã®å¼ã®æå°ãä¹æ³ã®ããæ¹ãç¥ã£ã¦ãæ¹ãããããé¡ããã¾ããçå¯¾æ° ã®å¾ãaã¨åçbã®å¤ãæ±ºãããã¨ãã§ãããï¼æ®å¿µãªããããï¼ ãã£ããã£ã³ã°ç¨ã«linestã¨ããé¢æ°ãç¨æããã¦ãã¾ãã ä¸è¬çãªä½¿ãæ¹ã¯ =linestï¼è¨ç®ã«ä½¿ãyã®ç¯å²ãè¨ç®ã«ä½¿ãxã®ç¯å²ãyåçã0ã«ãããããªããï¼ 「最小二乗の条件」を使った最小二乗法は、 ①線形の推定で ②統計的に偏りのない推定であり、 ③最小の分散を与える推定であることが分かっている。（詳細は「観測と最小二乗法」を参照）小二乗法（IRLS: Iteratively Reweighted Least Squares）を用いることにより、自動的に外れ値の影響を抑えて安定した補定値を得られることを示す。キーワード：繰返し加重最小二乗法（IRLS: Iteratively Reweighted Least Squares）、M 推定量、回帰補定 … ここで、a,bは切片、勾配と呼ばれる。 a,bを決定できれば、予測が可能である。練習1. ãæ¸ãå¿è¦ã¯ãé«æ ¡æ°å¦ã®ç¯å²ã«ããã¦ã¯ãªãã®ã§ããâ¦ æ¸ãããè¶ãã£ããããªãã§ããï¼ï¼( â¦ Î± jk = n i=1 g jg k/Ï 2 i ã¨Î² j = n i=1 (yi â f0)g j/Ï2i ãè¨ç® 3. ®ãç°ãªãå ´å xA,xBãã¨ãã«å¾ãããç¢ºçï¼åæç¢ºçï¼ï¼ç¬ç«ãªãç©ã«ãªã 2 2 2 2 2 ( ) 2 ( ) exp 1 ( , ) B B A A A B X A B x X x X P x x ÏÏ Ï Ï ãããæå¤§ã«ããXãæ±ããï¼æå°¤æ§å â¦ 直線近似の場合は、「線形近似」を選びます。 Linux Mint 13 Maya (64bit) での作業を想定。 g++ (Ubuntu/Linaro 4.6.3-1ubuntu5) 4.6.3; 1. ä½çã«ã©ããããã¨ã ããããä¾ãã°ãè³è²¸ã®é¨å±ã®åºãã¨å®¶è³ã®å¤æ®µã«ç¸é¢é¢ä¿ãããã¨ããããã¤ã¾ããåºãé¨å±ã¯ããã ãå®¶è³ãé«ãã¨ãããã¨ã§ãããã¯ç´æã«åãã¦ããªããã ã¨ããã°ãé¨å±ã®åºãã¨å®¶è³ã®å¤æ®µã®é¢ä¿ãå«ã¾ãããã¼ã¿ã»ãããããã¨ããé¨å±ã®åºãããå®¶è³ã®å¤æ®µãäºæ¸¬ã§ããã¯ãã ã çµ±è¨ãæ©æ¢°å¦ç¿ã®ä¸çã§ã¯ããã®ãããªåé¡ã®ã¸ã£ã³ã«ã«ãæå¸«ããå¦ç¿ãã®ãåå¸°ãã¨ããååãã¤ãã¦ããããã ãããã â¦ 今回は、最小二乗法で近似方程式で解くアルゴリズムを C++ で実装してみました。以下、簡単な説明と C++ ソースコードの紹介です。 0. 最小二乗法の例として，データの数が3つの場合（普通はもっとたくさんデータがありますが）にもっともらしい直線を求めてみます。 å°äºä¹æ³ï¼IRLS: Iteratively Reweighted Least Squaresï¼ãç¨ãããã¨ã«ãããèªåçã«å¤ãå¤ã®å½±é¿ãæãã¦ å®å®ããè£å®å¤ãå¾ããããã¨ãç¤ºãã ãã¼ã¯ã¼ãï¼ ç¹°è¿ãå éæå°äºä¹æ³ï¼IRLS: Iteratively Reweighted Least Squaresï¼ãM æ¨å®éãåå¸°è£å®ã å¤ãå¤ å½¢é¢æ°ã®æå°2ä¹æ³ 2. ãã£ããã£ã³ã°ããããæ°å¼ãæ±ºå® (ä¾ã§ã¯ y = Ax + B) äºä¹åã®å¼ãå±é; åä¿æ°ã§åå¾®å; é£ç«æ¹ç¨å¼ãè§£ãã¦ä¿æ°ã®å¤ãæ±ºå®

自賠責保険更新バイク, Ssd 換装容量増えない, 上野韓国料理カントンの思い出, リュックメリットデメリット, アフタヌーンティースヌーピースリッパ, 五苓散飲み合わせロキソニン, Position Absolute 中央からずらす, サッカー練習着上下,

月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

対数最小二乗法

こちらの記事もどうぞ

コメントを残すコメントをキャンセル

testestsets

対数 最小二 乗法

こちらの記事もどうぞ

空腹を紛らわす方法について！飲み物やツボなど ダイエット中の方は必見！？

お歳暮とは？時期やお礼状など

部屋につくタバコの匂い対策！！換気や消臭について

コメントを残す コメントをキャンセル

testestsets

対数最小二乗法

空腹を紛らわす方法について！飲み物やツボなど　ダイエット中の方は必見！？

コメントを残すコメントをキャンセル