Subject: 相関分析を行うには? ======================================== From: 黄色 Date: 1999/10/12(火) 16:37:03 初心者です。相関分析をやりたいのですが、また、その他の回帰分析など、エクセルでやれるんでしょうか?多くの例を出してくださるとありがたいです。お願いします。 ======================================== From: ぴころ Date: 1999/10/13(水) 07:12:16 黄色さん、おはようございます。 相関分析についての直接のお答えではないのですが、 技術評論社の「事例でわかるパソコンデータ分析入門-回帰分析編-」という本を買いたいと思っています。 黄色さんも、お読みになる機会がありましたら、買う前のわたしに、どうだったか教えてくださいねー。 うちの会社はレストランやファーストフードを何店舗ももっているんです。 わたしはオフィスでExcel97を使って売上や経費の管理をしたりしています。 一歩踏み込んで売上といろんな要素の相関関係の分析をしてみようと思っていたところ、 黄色さんのいい質問を発見(?)しました。 数学、ヨワイんですが、初心者以下のわたしでもできるでしょうか。 このスレッド、注目させてください。よろしくおねがいいたします。 ======================================== From: NAKA Date: 1999/10/13(水) 12:57:20 回帰分析でしたらエクセル97の分析ツールの「回帰分析」を使えば簡単にできます。 ただ気になる点は相関係数rが重相関 Rと表示されるのはおかしいと思うのですが・・・・ ======================================== From: ぴころ Date: 1999/10/14(木) 07:25:44 おはようございます。 Gasさんがおもしろいページを教えてくださいました。 http://www.komazawa-u.ac.jp/Gakubu/Takai_Seminar/PC_User3.htm ばたばたしていてよく見ていないのですが(というよりむずかしそうで)、 黄色さん、NAKAさん、いってみてください。 いいこと書いてあったらぴころにもかんで含めるようにして教えてください。 このスレッドにとても興味があるわけを書かせていただきます。 うちの会社はレストランやファーストフード店を何店舗も経営しています。 毎日オフィスには1日の売上や客数を書いたFAXが舞い込みます。 それをもとに、最初から作ってあったフォーマットを利用して、 Excel97で売上の毎日の入力、管理をしています。 一店舗一年一ファイル、一シート一ヶ月の仕様にしました。 毎日機能を追加工事しています。 Excelファンクラブで教えていただいた知恵がてんこもりです。 特に鈴木YさんやGasさんに直接アドバイスをいただいて、 かわいくて大切な宝物ファイルたちができました。 ある日会社で、「各店舗の売上の累計の最新データを一個所に常に表示するように、 その日付の一年前の累計と比較して増減のパーセンテージを出すように」って、 上司からいわれたので、 わたしは期首(7月1日)からの最新の累計額を全店舗分別なファイルのシートに集めて表示させたんです。 TOTALっていうタイトルで、全店舗の最新データを表示しました。英語の意味のことはよくわかりません。 ところが上司は、 入力しているその月の初めの日からの累計額の最新データを知りたがっていたのです。 で、すぐにご希望にそえるように作り直しました。 作り直した表で、ある店舗の最新データ(10月11日付)を前年と比較したら、 なんと40%も増えていたんです。ほかの店舗も増えていました。 わたしは 「こんな短い間でもって比較してもイミないじゃん。」 って思いました。 だって10月だけに注目してみたら(10月1日からの累計をみたら)、 確かに前年より全店舗がすごーくアップしてるんです。 でも、期首からの累計額を前年と比較すると、全店舗、もんのすごいダウンしてるんです。 数字って不思議だなって思っていたら、きのうの帰りがけに、上司が 「いやー、40%増か。やっぱり雇う人を変えると売上が急に違うね。」 っていってたので、 なんとなくそういうスパンで数字を欲しがっているわけがわかりました。 勉強不足のため、わたしにとっては今のところ、売上の数字はタダの数字でしかありません。 いい経営者は数字を読めるといいますが、 経営者とはどんな数字を知りたがっているのでしょうか。 うちの会社はまだ経費のことがぐちゃぐちゃで、整頓がついていません。 いろいろなことが整ってから、経営分析とまではいかないにしても、売上の分析くらいはしたいのです。 そうなったらぴころはぐわっしぐわっしとパソコンの勉強をして 売上を伸ばすためのいい分析をしようと思います。 ラウンジに質問をアップしようと思っていた矢先に 黄色さんからご質問があったので、チャンスだ!と思って便乗させていただきました。 自慢ではありませんが、もちろん回帰分析が何者かってことも知らないぴころです。 定石などがありましたらお知恵をお貸しください。 ======================================== From: NAKA Date: 1999/10/14(木) 23:15:36 黄色さん、ぴころさん、皆さんこんにちは、重回帰分析などは統計手法の中でも難しい 多変量解析の部類に入ります。エクセルを使えば難しい数式も簡単に解けると思います。 しかし、その前に統計手法についての勉強の必要性があります。と、言いますのは統計 解析で最も難しいのは解析の結果得られた数値を見てどう判断するかに掛かっているか らです。気象衛星から送られてきた天気図を見て明日明後日の天気を予測するのと同じ です。 厳しい事を言うかも知れないですがエクセルは単なる道具に過ぎません。エクセルが答 えを出してくれる訳でもありません。しかし、ある程度、統計の基本をマスターしてお ればエクセルは正に鬼に金棒なのです。市販されている統計手法の本を見てその数式を 入れてやることで計算は間違い無く確実にできます。単なる表計算ソフトが数十万円も する統計解析専用ソフトにも勝るとも劣らない威力を発揮するのです。私はある会社の 品質管理をやっておりまして管理図やヒストグラム、回帰分析、分散分析、有意差検定 などの手法を時々使います。数年前までは電卓でコツコツ計算していたのですが今では エクセルのおかげで随分と楽になりました。エクセル無しでは仕事が出来ないと言って も過言でないと思います。ぴころさんの目的「売上の分析」は素晴らしいと思います。エ クセルを武器に素晴らしいデータ処理ができます事をお祈りします。 ======================================== From: ぴころ Date: 1999/10/15(金) 06:51:53 黄色さん、NAKAさん、おはようございます。 NAKAさんは、思わず弟子になりたくなるようなすごい方なんですね。 上記の分析がなにをしているものなのか、いっこもわかりませんでした。 お教えいただいたとおりに、まず分析の基本的なことをぼちぼちと学んでゆきたいと思います。 わたしは高校にもいっていますが、今、数学では指数関数、対数関数、物理では振子の振動っていうのをやってます。 これらの基本的なことが分析に役立つかもしれない(ほんとかー)ので、 まずは学校のレポートをしっかり作成しなくてはいけませんね。 黄色さんが相関分析の具体的な例をお待ちですので、どなたからかレスをいただけるのを わたしも楽しみにまっています。 ======================================== From: NAKA Date: 1999/10/16(土) 11:41:47 黄色さん、ぴころさん、こんにちは。NAKAです。 私には弟子を持つ程の才能はありませんよ(笑) いつも本を見ながらコツコツやっておりまして・・・ 回帰の話をちょっと書きこんでみました。 重回帰となるとかなり難しいのですね。単回帰であれば解りやすいと思います。 統計解析の教科書によく出てくる単回帰の例に父親の身長と息子の身長の関係が あります。父親の身長をX、息子の身長をYとして考えます。(Xを独立(説明) 変数、Yを従属(結果)変数と言います)得られる回帰式はY=a+bX(数学 の教科書はY=aX+bと表現されている)aが切片(エクセルのINTERCEPT 関数で求まります)、つまりXが0の時のY軸の値です。bが傾き(エクセルのSLOPE 数で求まります)です。得られた回帰式を元に父親の身長から息子の身長を予測 できる訳です。逆に息子の身長から父親の身長を求める場合は回帰の逆推定です からY=a+bXの式を変形してX=(Y−a)/bとし息子の身長Yを入れて やると父親の身長Xの予測ができる訳です。また、XとYの関係の強さを表す方 法としては「相関係数r(エクセルのCORREL関数で求まります)」がありま す。絶対値が1に近い程XとYの関係が強いと言えます。例えばr=0.999 などはかなりの相関関係があります。ではrの値が0.8位だったらどうだろう と考える場合は回帰分散分析(エクセルの分析ツールでできる)などの結果(回 帰分散VRと誤差分散Veの分散比F0)で判断できます。ここでの注意点とし てはXとYの関係が曲線関係であればrでは判断できないので別の多項式を考え る必要があることです。つまりいくら相関が強くても曲線関係であればrは1に はならないのです。大体このような内容の話が統計の教科書に書いてあります。 重回帰になりますとXつまり独立(説明)変数が2つとか3つになります。 以上ですがとりあえず身近に有るデータをエクセルに入れて相関係数を求めてみ るのも面白いと思います。 そうすることで何となく解り、そこで統計の教科書を開けて見るのが宜しいかと思います。                                   以 上 ======================================== From: ぴころ Date: 1999/10/17(日) 07:47:45 黄色さん、NAKAさん、おはようございます。 NAKAさんの、親子の身長のお話は、 統計学のわかりやすい例としてマジメに取り上げられているんですね。 そんなことも知りませんでしたが、チビのわたしは楽しくてにこにこしながら、 いろんなことが少しわかってきました。 といっても、 数学のレポートは関数でできるんだ。 既知のxや既知のyの意味。 ・・・くらいで、NAKAさんに本当にもうしわけないのですが。 相関係数が1になるっていうことは、絶対にその関係があるっていうことで、 それより少なかったら「だいたい8割方は相関関係があるといえる」ということでしょうか。 「ではrの値が0.8位だったらどうだろうと考える場合は・・・」からは まったくわかりません。 しかし、NAKAさんのおっしゃったように、既知のデータをたくさん集めて その関係を調べてみるのはとっても楽しそうです。 たとえば売上と、その数字を左右する条件をひとつだけ選び、条件を変えて組み合わせて 一番相関係数が1に近いものをこれから売上の予想に使えるかもしれません。 これは、統計ということをしたことがないわたしが言えることではないんですが、 現実は案外単純で、もしかしたら条件一個でだいたいの売上が予測がつくっていうこともあるかもしれません。 まずはそのあたりから始めたいと思います。 ありがとうございました。 これから急いで学校にいかなくちゃいけなくてあわてていますので、 文がぞんざい&意味不明になってしまって もうしわけありませんでした。 なんかハヤトチリしているところがありましたら教えてください。 ======================================== From: NAKA Date: 1999/10/17(日) 11:03:10 ぴころさん、おはようございます。 相関係数rとよく似た数値として寄与率というのがあります。 寄与率はrを二乗して求めます。それに100をかけるのです。 例えばrが0.8だったら0.8^2×100=64%となり、これはどういう ことかと言いますと。XはYに対して64%関係していると言うことです。 64%が高いか低いかは自分で判断すべき問題なのです。 64%が高いか低いかの判断材料として、回帰分散分析などがあります。 それから、そうですね。身近に有るデータを解析してみて下さい。 しかし、そこで注意点として、本当は何の関係も無いデータでもたまたま相関係数が 1に近かったりすることがありますから、よく考えて解析して下さい。 ======================================== From: ぴころ Date: 1999/10/17(日) 20:11:06 NAKAさん、難しいお話をわかりやすく解説してくださってありがとうございます。 以下は、よくわからないままに、思っていることをムリムリ説明しようとしていますので、 表現に適切でないところが多々あると思いますが、NAKAさんが翻訳して読んでくださいまし。 相関関係の強さを見る判断材料として(?)相関係数よりもっと信頼性の高い(?) 「寄与率」というものがあるのですね。 こういう判断材料になる数のことをさしてなんていうんでしょうかねー。 以前、Excelを覚えたてのころ、株のさや取り(両建てともいうそうです)をしているひとのために 8MBちかいファイルを作ったことがありました。 普通は株価が安いときに買って、高くなったら売って、っていうやりかたですが、 さや取りは2つの銘柄を組み合わせて、片方を売って、もう片方を買い戻して、ってして、 儲けは少ないけど、手堅い方法なんだそうです。 わたしは株についてはまったくわかりません。 ここからはNAKAさんが株にご興味がおありでなかったら読み飛ばしてください。 そのひとはどこかで手に入れた数式で計算して、株を売ったり買いもどしたりするタイミングを 決めていました。 「どうしてさやの動きの最大幅を、さやを足したもので割ってパーセンテージにするの?」って 質問しても、「どうしてかわからないけど、この数字が○%になったときに買って、 ○%になったときに売るタイミングなんだ。この数が一番あたってるんだ。」というだけで、 本人にも説明がつかないみたいでした。 そのオリジナルの数式を考えた人にはちゃんとした理論があるとは思いますが。 NAKAさんの >64%が高いか低いかは自分で判断すべき問題なのです。 >しかし、そこで注意点として、本当は何の関係も無いデータでもたまたま相関係数が >1に近かったりすることがありますから、よく考えて解析して下さい。 を読んで、上記の株の数式のことを思い出しました。 「統計」には数字を出す正確な手順と、出た数字を読む能力も大切だということでしょうか。 世の中の事象は非線型の領域で生まれ、動いているのかもしれませんからね。 (↑これ、ほんとにぜんぜんわかってない発言ですが) ファイルのサンプル、ごそごそさがして、みつけました。 このラウンジで、以前株の計算式を出せないかとのご質問があったと思いましたが、 株にご興味のあるかたも少しいらっしゃるとは思います。 NAKAさん、このファイル、覗いてみますかぁ? 数Uβの教科書にはこんなことは載ってませんでした。 今日、こないだの前期試験結果がわかりました。げげっ(^^;; さて、明日から会社で売上については勉強のために、ぼちぼち分析の目で見ようと思います。 手始めに毎日の売上額と曜日の関係を分析しようと思います。 それからお天気。 あとはイベント。 景気をあらわす数字をどこかからひろってきて、それとの関係とかも。 え。。。と。。。 まず、やっぱり本を買うべきですよね。 やりかたが一歩からわかりませんので(笑) ======================================== From: 黄色 Date: 1999/10/18(月) 10:42:47 ぴころさん、NAKAさん、こんにちは。最初の質問者のくせに話し合いに参加できずに申し訳ありません。まるで、ぴころさんが質問者のようですね。 NAKAさんの相関分析は、大変参考になりました。早速研究の分析を行ってみたいと思います。また、それらのアドバイスと、自分なりに勉強してみたので、それを紹介します、おかしいところがあれば指摘していただけるとありがたいです。 まず、相関係数を算出する係数ですが、CORRELというのがあります。つまり、変数Xと変数Yとの相関係数を求めようとするとき、 CORREL(変数Xのデータの範囲、変数Yのデータの範囲) を行うと出てきます。また、散布図を使えば、その相関係数によって、二つの変数が、どの程度直線の関係にあるかどうかがわかり、相関係数が、図によってイメージすることが可能です。 一般的な統計の教科書によると、相関係数は0.8以上だと強い相関がある、0.6〜0.8だと、相関がある、0.4〜0.6だと弱い相関がある、0.4より小さいとほとんど相関がないと判断できるそうです。しかし、これもデータの数が少ないと、あまり参考にならないそうです。 こんなことが、NAKAさんのお話を読み勉強したことです。何かあれば訂正してください。 もう、解決でいいような気がしますが、また、いろいろ尋ねたいと思いますので、このまま未解決にしますので、よろしくお願いします。 ======================================== From: NAKA Date: 1999/10/18(月) 22:26:43 黄色さん、こんにちは、散布図を書くのはとても良い事だと思います。 何故なら、面倒な計算をするよりも散布図で見る方がはるかに優れているからです。 関数を使えば簡単に相関係数も解りますが、それより先に散布図で見るべきなのです。 数値化したものを見るより直感的に解る方が優れています。 (直感的に見る代表的なものに管理図があります) >相関係数は0.8以上だと強い相関がある、0.6〜0.8だと、相関がある、 >0.4〜0.6だと弱い相関がある、0.4より小さいとほとんど相関がないと判断できるそうです。 大体の目安としてはそうですね。 それでは、黄色さんもぴころさんも目標に向かって頑張って下さい。 応援しています。      NAKA ======================================== From: Arsene Date: 1999/10/18(月) 23:59:48 みなさんこんにちは。次はいつこれるかな? NAKAさんの >散布図を書くのはとても良い事だと思います 全くその通りで、大学の頃は、分析する前に必ず図を書けと口を酸っぱく言われたものです。 あと、多分あんまり参考にならなくかつ、読んでいる人が少なくて密かに埋もれていると思われる過去の作品です。 http://www.fuji.ne.jp/~excelyou/qk31.htm 今ならもう少しまともなコードを書けるし、また計算誤差についてあまり考えずにやったのですが、 [1]のbに当たる部分が、回帰分析の係数に当たります。 回帰分析って理論的にはこんなことをやってるよという一つの例です。 それではまた。 ======================================== From: ぴころ Date: 1999/10/20(水) 07:06:34 黄色さん、NAKAさん、arseneさん、おはようございます。 「事例でわかるパソコンデータ分析入門-回帰分析編-」、買ってきました。 楽しい本です。一分以内で回帰分析ができるソフトも付いてます。 散布図はハイサーグラフを描いたときに使ったくらいですが、 このへんからまたぼちぼち慣れて行きます。 会社の1日の売上と客数の相関係数や寄与率が高いと予想して出したのですが、 思いに反して、けっこう低かったのはなぜでしょうか・・・。 上記の本に例題として、ビールの売上と気温や曜日、宣伝効果との相関がのってます。 こうやって楽しんでいるうちに、Excelのほうも使えるようになると・・・・思います。 arseneさんのおすすめのページにいきましたが、ぜんぜんわからなくてごめんなさい。 ・・・・・・もちょっと遊んでみようっと。 上司にDTPを習えとか言われて、5足目のワラジをはかされそうです。 回帰分析が学べるのは今のうちです。 最初の質問者じゃないくせにひとりごといって、もうしわけありません、黄色さんー。 ======================================== From: NAKA Date: 1999/10/20(水) 21:50:58 エクセルファンの皆さん、こんにちはNAKAです。 Arseneさんは、統計も数学も両方お得意のようで凄いと思います。 さて、統計を初めて勉強する時、数式の数々を見て諦めてしまう方も多いと思い ます。しかし、統計は数学のようで実は数学ではないのです。途中の難しい数式 の意味は解らなくても良いんです。要はバラツキや変化をどう見るか、これが重 要なポイントだと思います。直感的な部分が多くを占めていると思います。 黄色さん、ぴころさんも解らない部分はこだわることなく読み飛ばして後は EXCEL様のお力をお借りしたら良いと思います。そして、ある程度意味が解 りかけてきた時にArseneさんのプログラム等に書かれた数式をじっくり見ると 「なーるほど」と、なる訳であります。 散布図を書いてみるといった部分は人間の直感的な部分のトレーニングなんです。 水墨画で書かれた白黒の絵を見て綺麗だなぁと思うのと同じです。 では、                             NAKA ======================================== From: ぴころ Date: 1999/10/22(金) 06:20:03 みなさんおはようございます。あーねむ。 きのう、レストランやファーストフード店の客数が、売上とどんな関係になるかを、 CORRER関数を使って相関係数rを月ごとに出し、それを自乗して寄与率も出しました。 わたしの予想では限りなく1に近い数字がどの店舗も出るはずでした。 たしかに0.9以上の店舗もたくさんありましたが、驚いたのは相関係数rが0.2から0.6台の店舗があったことです。 さらに驚いたのは、マイナスの店舗がありました。マイナスって!! よーく考えると、客数、売上の出し方なんですが、レストランはランチタイムとディナータイムがあって、 客単価の低いランチタイムの客数がどんなに増えても売上増大にはあんまり寄与しないんだって思いましたが、 これはあってますか?ほかにどんなことがわかりますか? どんな近似曲線の種類、たくさんあって、なんだかわかりません。 幼稚ですみません。 散布図を作って近似曲線を追加して、オプションも追加して、数式とR^2も表示させました。 あ、ちゃんとでている〜(^^) 数式はぜんぜんわかりませんが。 曜日が売上にどんな風に関与しているのか調べたいと思います。 もとの表では曜日は、日付のシリアル値から割り出した1から7までの数字を、書式で曜日にして表しています。 きのうこれをやりかけたのですが、散布図がばらばらすぎて、わけわかんなくなってしまいました。 今日出勤して(このスレッドのお勉強だけが目的で出勤するんです。ナイショです) 続きをやってみようと思います。どうか急ぎの仕事がありませんように。 黄色さん、このスレッドをレベルの低い書き込みで汚してもうしわけありません。 ======================================== From: NAKA Date: 1999/10/22(金) 12:36:48 皆さんこんにちは、ただ今昼休み会社で書き書きしています。 ぴころさん頑張ってますね。 rがマイナスになるのは負の相関がある場合です。 Xが増えるとYが減る様な現象の時にそうなります。 計算するだけでなく散布図を書いてみて下さい。 よーーく解ると思います。                    NAKA ======================================== From: ぴころ Date: 1999/10/23(土) 06:49:36 おはようございます。 NAKAさん、カキコをありがとうございました(^^) 応援してくださるかと思うとうれしくてがんばれます。 >rがマイナスになるのは負の相関がある場合です。 >Xが増えるとYが減る様な現象の時にそうなります。 お客が増えると売上が減るお店なんて、チョー悲しいですね(笑) 昨日は仕事 中にこの散布図を描く時間がなくなりましたので、残念ですが来週になっちゃうんです。 一過性の現象だとは思いますが、マイナスであった一ヶ月分の散布図を描き、そういう時期をもつ店舗の、 期首からの通しの分の散布図がどういうカタチをしているか、みてみます。 それから、散布図を描くにあたって、やはりたった一ヶ月だけのデータでは参考にならないみたいです。 みていてつまらないというか、信頼できないんです。 データの量はなるべくたくさんなくちゃいけないかもしれません、この場合。 きのう仕事中に散布図を描いたりして、結果や出てきた疑問をtextにとっておいたんですが、 どうもFDでもってきたつもりが、ショートカットしかはいってなかったので、 来週またカキコさせていただきます。そのときもよろしくおねがいいたします。 ======================================== From: ぴころ Date: 1999/10/25(月) 20:12:58 黄色さん、NAKAさん、arseneさん、こんにちは。 今日出勤して売上と客数の散布図を描いてわかったことがありますので ご報告させていただきます。 あるレストランの1日の売上に、変数 x である「1日客数」、「ランチ客数」、「ディナー客数」が どのような関係にあるか、期首(7月1日)から現在までの通しのデータに基づいてグラフを描きました。 「1日の客数」については、てんてんが2つの島になっていて、多いほうの下側の島は近似曲線にそって (そって並んでいるという表現は正しくないのかもしれませんが、見た目はそう見えちゃいます) まーだいたいならんでいる風なのに、上のほうの小さい島はバラバラッとしたカンジです。 寄与率は0.2651でした。黄色さんのログによりますと、相関関係はほとんどないといっていいみたいです。 「ランチ客」との相関関係を調べてみると、夜空の星みたいで、寄与率なんか-0.0092でした。 さて、「ディナー客」ですが、ほぼ右上がりの近似曲線にそっててんてんが並んでいて、寄与率も0.8295と 高い値を示していました。データの数を1ヶ月分から増やしたので、よりわかりやすくなってよかったです。 上司に「当たり前のことですが、ランチなんかいくらお客がきても、 ディナーで入らなきゃ売上が伸びませんよ。」といって散布図を3枚見せると、 「これはぜひ役員に視覚で訴える資料にさせてくれ。」といってもってってしまいました(^^;; 散布図を描くときの元の値を期首から期末までにして未入力のセルも含めてしまうと、 でたらめなグラフができてしまいます。 元の値には最終入力行までが自動的に設定されるように、関数で考えなくちゃいけませんねー。 つぎにファーストフード店の1日の売上と、「1日の客数」の散布図ですが、これはとってもきれいに 右上がりの近似曲線にそっててんてんがならんでいます。 ただし、このファーストフード店は1週間に1度休みで、 つまりその日は売り上げも客数も仲良く 0 ということなので、 その要素が相関関係をより強めているのではないかとおもいます。 開店日だけのデータを元の値にしないと、正確な散布図が描けないのでは、っておもったら、 退社の時間になっちゃいました。 以上、小学校の観察日記みたいですが、今日、ぴころがおもったことです。 ======================================== From: Arsene Date: 1999/10/27(水) 00:53:33 こんにちは。 エクセルの動きの自体の話ではないので短めにします。 [1]大きい方の島が平日で、小さい島が土日と思われます。 少なくともこの2通りをわけて分析する必要があります。 [2]変数 x である「1日客数」、「ランチ客数」、「ディナー客数」 もしそれぞれの日で、「1日客数」=「ランチ客数」+「ディナー客数」にかなり近い場合には、多重共線性という問題があります。もし回帰分析をするなら、少なくとも一つは使わないで下さい。 [3]黄色さんの「多くの例を出してくださるとありがたいです」に対応していると思いますので黄色さんも是非書き込んで下さい(といっても次に答えられるのはいつか分かりませんが)。 それでは。 ======================================== From: ぴころ Date: 1999/10/27(水) 05:35:53 みなさまおはようございます。 arseneさん、お忙しいところレスをつけてくださいましてありがとうございます。 >[1]大きい方の島が平日で、小さい島が土日と思われます。 >少なくともこの2通りをわけて分析する必要があります。 ある要素が原因で特別な値を示していると、明らかに分かる場合には、その要素を持つデータだけは 分析からあらかじめ外しておいたほうがいいということでしょうか。 これから土、日、祝日のデータと分けて分析することにします。 >[2]変数 x である「1日客数」、「ランチ客数」、「ディナー客数」 >もしそれぞれの日で、「1日客数」=「ランチ客数」+「ディナー客数」にかなり近い場合には、 >多重共線性という問題があります。もし回帰分析をするなら、少なくとも一つは使わないで下さい。 え(@@;; あのデータは、ランチ客+ディナー客=1日客そのもの、です。 だめなんですか? たじゅうきょうせんせい・・・ですか、難しくておっしゃっていることの意味がほとんどわかりません。 勉強不足で申し訳ないとおもっています。 >[3]黄色さんの「多くの例を出してくださるとありがたいです」に対応していると思いますので >黄色さんも是非書き込んで下さい(といっても次に答えられるのはいつか分かりませんが)。 黄色さんのスレッドを、我が物顔に歩き回っていて、本当にすみません。 改めてほかのスレッドで質問させていただきたいと思いますが、黄色さんはいかがお考えでしょうか。 ======================================== From: Arsene Date: 1999/10/30(土) 01:31:30 こんにちは。 多重共線性・・・買われた統計の本に載っているかなーとおもって書いたのです。載っていると思うのですがどうでしょ? 言葉は難しいですが意味は言葉ほどインパクトはありません。大したことないです。 詳しい話はここでは書きませんが(なんせエクセルから全然離れるので))、もう少ししたらメールしますね。 あくまでも回帰分析での話です。図・相関分析はやはり重要です。 それでは。 ======================================== From: ぴころ Date: 1999/10/30(土) 07:03:50 arseneさんおはようございます。 おへんじありがとうございます。 散布図を描くにあたって、 @元の値ですが、休みの日をとばして上のセルから順番に売上や客数をつめて表示する。 Aグラフのもとの値の範囲を自動的に広げて行く(数値の入力が毎日あるため) 以上の支度をしなくちゃいけません。 過去ログを参考に数式を入れているんですが、 どうもうまくいきません。 わからなくなりましたら、ほかのスレッドで新たに質問をさせていただくと思います。 わー、メールくださるのですか? それはそれはとっても楽しみにしていますねーo(^-^)o よろしくおねがいいたします。 ======================================== From: ぴころ Date: 1999/11/03(水) 13:07:24 Arseneさんに直々にお世話になりながらちょっとずつ回帰分析の雰囲気をつかんできました。 雰囲気だけですけどね。 Arseneさん、ありがとうございます。 今日は統計関数についてちょっとヘルプをみてみました。 PEARSON関数ってのがありまして、CORRER関数で出た結果と同じ値を返してくれました。 なんで同じになるんですか? このピアソン関数って、そもそもなんでしょうか・・・。 LINEST関数っていうの、発見。これ、いろいろできそうですね。 あー、数学のレポート、これでできたんですね。気づくの、おそかったです。 補正項についてはぜんぜんわかりません。 r2とか、F検定っていう値も出るそうですが、使い方がイマイチ(^^;; "とりあえず =LINEST(A1:A10,C1:C10,TRUE,TRUE)と入力しておきましたが・・・。" LINESTで出た数字って、分析ツールで出たX値1なんですねー。 その前に分析ツールで出たレポートの意味をよーく把握しなくっちゃ。 このLINEST関数では多変数の場合でも、線形モデルでの回帰分析もできるのですね。 自分で書いていて、意味がよくわかっちゃいないんですが。 また、FORECAST関数っていうので売上の予測もできるんですね。 でも、フィッシャー変換っていうのを先にしなくちゃいけないんですか・・・。 FISHER関数で?なんですか、それ。 あーつかれたー。みなかったことにしましょうっと(^^;; どなたか、フォローをよろしくおねがいいたします。