ビジネスデータ分析Ⅱの提出物、最後の課題の記事続き?です。
※この記事がなくても、1&2期生の皆さんは単位を取りましたし1期生は卒業していきました。
前回記事はこちら。
【東京通信大学】ビジネスデータ分析Ⅱ:最後の課題Analysing 7 Generations…なにやるの?
講義であった、「データを眺める」「眺めてください」という事ですよね。
伝説のポケモン/非伝説のポケモンは、何が違うのか?
をデータから各自検討してみる(xxxのパラメータで分類できるのではないか?を考えてみる)ということです。
大事なこと
判定結果
これで判定結果を出すことはわかってますよね?講義のとおりです。
1 2 3 4 5 6 7 8 9 10 11 |
library(MASS) pokemon<-read.csv("pokemon_win.csv") attach(pokemon) data<-data.frame(japanese_name, attack, defense, sp_attack, sp_defense, speed, hp, is_legendary) rownames(data)<-data[,1] data<-data[,-1] detach() result<-lda(is_legendary~., data) plot(result) ※plot.new() でエラー: figure margins too largeは無視 table(data$is_legendary,predict(result)$class) |
こうなりました。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
> library(MASS) > pokemon<-read.csv("pokemon_win.csv") > attach(pokemon) > data<-data.frame(japanese_name, attack, defense, sp_attack, sp_defense, speed, hp, is_legendary) > rownames(data)<-data[,1] > data<-data[,-1] > detach() > result<-lda(is_legendary~., data) > plot(result) > table(data$is_legendary,predict(result)$class) 0 1 0 719 12 1 45 25 |
結果の以下の数値が判定結果です。
説明があった、なかった。ではなく、行間を読んで講義を聞く必要がありますよ。
0 | 1 | |
0 | 719 | 12 |
1 | 45 | 25 |
要するに
0:判定結果(非伝説) | 1:判定結果(伝説) | |
0:非伝説 | 719匹(正しく、非伝説と判定できた) | 12匹(非伝説だが、伝説と判定された) |
1:伝説 | 45匹(伝説だが、非伝説と判定された) | 25匹(正しく、伝説と判定できた) |
個々の制度を高めていくことが、課題レポートで求められています。ちなみに制度100%を出すのではなく、講義の状態より良くなる分析結果を提出できると良いでしょう。
※現状は、(719+25)/(719+12+45+25)ですので、744÷801で0.92(92%)ほどの精度でしょう。
眺める
1 2 3 4 |
pokemon<-read.csv("pokemon_win.csv") summary(pokemon) pokemon2<-pokemon[pokemon$is_legendary=='1',] summary(pokemon2) |
何度も言います?が、
伝説、非伝説のポケモンについてデータを出して、眺めるんです(見比べる)。
※講義を聞いて、何を意図しているのかを汲み取ってくださいね。
pokemon2<-pokemon[pokemon$is_legendary==’1′,]
pokemon2<-pokemon[pokemon$is_legendary==’0′,]
眺めていたら、少し数値が異なることがわかりますね?
このあたりをうまく使って、伝説のポケモンの特徴を捉えることができそうです。
で、何をすれば・・・?
眺めて、各自が考えた、この部分で分類できるのではないか?を確認し、レポートにまとめましょう。
何やればよいのかわからない
パラメータを変えるということは、以下の部分を変えて実行してみるということです。
data<-data.frame(japanese_name, attack, defense, sp_attack, sp_defense, speed, hp, is_legendary)
1 2 3 4 5 6 7 8 9 10 11 |
library(MASS) pokemon<-read.csv("pokemon_win.csv") attach(pokemon) data<-data.frame(japanese_name, attack, defense, sp_attack, sp_defense, speed, hp, is_legendary) rownames(data)<-data[,1] data<-data[,-1] detach() result<-lda(is_legendary~., data) plot(result) ※plot.new() でエラー: figure margins too largeは無視 table(data$is_legendary,predict(result)$class) |
そうしたら・・・
例ですが、以下のように精度が上がってくるということです。
それをレポートにしましょう。
0 | 1 | |
0 | 729 | 2 |
1 | 7 | 63 |
※精度が良くなりましたね
そして・・・
各種パラメータについて各自の考察をもとに、何度も判定等を繰り返して、自分の結論を導き出して、証明したデータ等をレポートとして提出しましょう!!
まとめ
- 非公開、有料級の情報でした。
- 1期生は、特に誰にも聞いたり確認もできない、極度の不安の中、課題提出されていました。
- ちなみに、私は表紙を入れて11枚のレポートになりました。