Ayu Hamasaki's easy-to-understand science
Ayu Hamasaki's easy-to-understand science
  • 230
  • 107 400
【 #機械学習 】#ロジスティック回帰 パラメータ最適化シリーズ(その3)Rで交差エントロピー損失関数と勾配降下法数を体感!#統計学 #エントロピー #わかりみサイエンス #ツルマキマキ
【 #機械学習 】#ロジスティック回帰 パラメータ最適化シリーズ(その3)Rで交差エントロピー損失関数と勾配降下法数を体感!
#統計学 #エントロピー #わかりみサイエンス #ツルマキマキ
ロジスティック回帰シリーズ、ロジスティック回帰のパラメータ最適化に関して、3つのシリーズに分けてお送りします。今回(その3)では、実際にRで搭載して、交差エントロピー損失関数と勾配降下法数で、パラメータの最適化を体感してみましょう!
00:00 イントロ
00:33 本日のコンテンツです
00:36 1.学習データの定義
01:18 2.ロジステック関数の初期パラメータ
01:42 3.ロジステック関数の式
02:36 4.交差エントロピー損失関数J
03:18 5.勾配降下法によるパラメータ更新
05:36 6.最終パラメータの結果
06:42 7.損失関数と回帰曲線のプロット
07:43 8.新しいデータの予測
09:30 参考動画1 ロジスティック曲線とロジスティック方程式
th-cam.com/video/99ijXJtchpE/w-d-xo.htmlsi=31n91umU6yheUpc4
09:37
08:31 参考動画2 ロジット変換
th-cam.com/video/M1P3M5sjQjI/w-d-xo.htmlsi=14cVXU5wKzKZc0iY
10:04 わかりみサイエンス!
■わかりみサイエンス 過去で人気の動画 Best5 (過去90日)
第1位:ネイピア数の定義式
th-cam.com/video/ViZkXxkoUfA/w-d-xo.html
第2位:ロジスティック曲線とロジスティック方程式
th-cam.com/video/99ijXJtchpE/w-d-xo.htmlsi=ogeOxLghWop0GV7H
第3位:ポアソン分布から指数分布を簡単にもとめる!
th-cam.com/video/vzkBQiySnhA/w-d-xo.htmlsi=a52LFRVAB9NIXCEu
第4位:MCMC法1 モンテカルロ法で積分を求める 統計ツールRでやさしく説明
th-cam.com/video/5LRo0BgZUh8/w-d-xo.html
第5位:なぜ n-1 で割る? 標本分散 と 不偏分散 の違い
th-cam.com/video/ftwQN-rZMfA/w-d-xo.htmlsi=l0vxsFEOBJYjHgCb
第6位:クラスカルウォリス検定 (その1) 3つ以上の標本の平均順位を比較するノンパラメトリック検定
th-cam.com/video/rlvCfzJofiA/w-d-xo.htmlsi=THTHYof3uRB6k5HQ
■全体が見わたせるチャンネル
★人気動画★・わかりみサイエンスチャンネル
th-cam.com/channels/MnklUDCVxD_PflxfjIwLcg.html
★人気動画★・わかりみサイエンスチャンネル紹介
th-cam.com/video/ldeypZN1v2Q/w-d-xo.html
■参考文献
zero2one.jp/learningblog/machine-learning-logistic-regression/
ieyasu03.web.fc2.com/Deep_Learning/5-loss_function.html#mjx-eqn-eq10
■通常使用している使用したフリー素材
◎PAKUTASO
にゃるる www.pakutaso.com/nyaruru.html
河村友歌 www.pakutaso.com/person/woman/kawamurayuka/
◎ photo AC www.photo-ac.com/
◎ 動画 AC video-ac.com/
◎ illust AC www.ac-illust.com/
■紲星あかりのダンス MMD 
・MMDファイル
モデル製作:つみだんご様
つみ式紲星あかり(水着)
3d.nicovideo.jp/works/td37618
■弦巻マキのダンス
・キャラミンOMP(おんぷ)
www.charamin.com/
・キャラミンStudio
www.ah-soft.com/charamin/
・AHS社弦巻マキmmd
www.charamin.com/
■使用したフリーBGM
作曲者⇒ 甘茶(英語表記=Amacha)
URL⇒ amachamusic.chagasi.com/
サイト名⇒ 甘茶の音楽工房(英語表記=Music Atelier Amacha)
曲名⇒長靴でお出かけ(ラスト)、船の旅(メイン)
amachamusic.chagasi.com/
amachamusic.chagasi.com/music_natsuyasuminotanken.html
amachamusic.chagasi.com/music_funenotabi.html
amachamusic.chagasi.com/music_natsuyasuminotanken.html
amachamusic.chagasi.com/music_omegacentauri1.html
amachamusic.chagasi.com/music_yuuzoranihabatakukokoro.html
■動画制作には以下のツールを使いました。
声:
ayu hamasakiさんの声 ⇒ 音読さん 
CeVioAI Ver8.1.12.0
弦巻マキ(日、英)(田中 真奈美)
小春六花
cevio.jp/
VOICEROID+EX 民安ともえ(弦巻マキ)
VOICEROID2 紲星あかり
VOICEROID2 結月ゆかり
www.ah-soft.com/voiceroid/maki/
弦巻マキ、紲星あかり、結月ゆかり、小春六花
Reccotte Studio
www.ah-soft.com/rs/
■女性キャラクターと動画作成ツール
ChatGPT 4o
Leonard AI
Microsoft Copilot
PixiVerse
ImageFX Google
Hailo AI
มุมมอง: 53

วีดีโอ

【 #機械学習 】#ロジスティック回帰 パラメータ最適化シリーズ(その2)勾配降下法数 #エントロピー #統計学 #わかりみサイエンス #ツルマキマキ
มุมมอง 34วันที่ผ่านมา
ロジスティック回帰シリーズ、ロジスティック回帰のパラメータ最適化に関して、3つのシリーズに分けてお送りします。今回(その2)では、ロジスティック回帰における勾配降下法を中心に、その仕組みや導出方法を解説します。 特に交差エントロピー損失関数を用いたパラメーター更新の数学的導出に焦点を当てます。 00:00 イントロ 00:41 本日のコンテンツです 00:44 1. ロジスティック回帰の基礎 02:26 2. 交差エントロピー損失関数 02:51   その1の参照 ロジスティクス回帰パラメータ最適化(その1) 交差エントロピー損失関数 th-cam.com/video/1vkiH-YnfkU/w-d-xo.htmlsi=jRqIwsuMldIHU7GT 03:06 3. 勾配降下法によるパラメータ更新 04:38 4. 交差エントロピー損失関数の微分 08:24 参考動画1 ロジステ...
【 #機械学習 】#ロジスティック回帰 のパラメータ最適化 シリーズ(その1)交差エントロピー損失関数 #統計学 #エントロピー #わかりみサイエンス #ツルマキマキ
มุมมอง 6214 วันที่ผ่านมา
ロジスティック回帰シリーズ、ロジスティック回帰のパラメータ最適化に関して、3つのシリーズに分けてお送りします。今回(その1)では、ロジスティック回帰において、モデルの予測確率と実際のクラスとの不一致を測定し、それを最小化することで性能を向上させる交差エントロピー損失関数の導出について解説します。 00:00 イントロ 00:46 本日のコンテンツです 00:48 1.ロジスティクス回帰の確率モデル 01:15 2.交差エントロピー損失関数の導出 01:27 ・尤度関数 02:11 ・全体の尤度 02:21 ・負の尤度関数 03:12 ・交差エントロピー損失関数 04:38 3.例題 05:43 参考動画1 ロジスティック曲線とロジスティック方程式 th-cam.com/video/99ijXJtchpE/w-d-xo.htmlsi=31n91umU6yheUpc4 05:49 参考動...
【#統計学】身近で大事な相乗平均!相乗平均はどんなときに使うのか?ということを例題を使って解説します!#相乗平均 #平均 #機械学習 #わかりみサイエンス
มุมมอง 11921 วันที่ผ่านมา
平均といってもいろあります。身近で大事だよ! 相乗平均とは、n個の正の実数の積のn乗根をとったものです。今回の動画では、成長率や比率を扱う際の相乗平均の便利さについて、簡単な例題で学びましょう! 00:00 イントロ 00:10 本日のコンテンツです 00:13 1.算術平均と相乗平均 01:25 2.例題 03:46 3.相加相乗平均の不等式 05:03 わかりみサイエンス! ■わかりみサイエンス 過去で人気の動画 Best5 (過去90日) 第1位:ネイピア数の定義式 th-cam.com/video/ViZkXxkoUfA/w-d-xo.html 第2位:ロジスティック曲線とロジスティック方程式 th-cam.com/video/99ijXJtchpE/w-d-xo.htmlsi=ogeOxLghWop0GV7H 第3位:ポアソン分布から指数分布を簡単にもとめる! th-cam...
【#統計学】ポアソン分布から指数分布を簡単にもとめる!ポアソン分布から指数分布を簡単に求めることができるので紹介します。#ポアソン分布 #指数分布 #機械学習 #わかりみサイエンス
มุมมอง 456หลายเดือนก่อน
ポアソン過程では、ポアソン分布と指数分布が重要な役割を果たします。ポアソン分布は「一定時間内の回数」を表し、指数分布は「次の出来事までの時間」を表します。ポアソン分布の「出来事がバラバラに起こる」という特性から、待ち時間は短いほど起こりやすく、長いほど起こりにくくなるため、自然と指数分布になります。 ポアソン分布から指数分布を簡単に求めることができますよ! 00:00 イントロ 00:09 本日のコンテンツです 00:12 1.ポアソン過程 01:15 2.ポアソン分布から指数分布を求める 03:55 3.指数分布の例題 05:12 わかりみサイエンス! ■わかりみサイエンス 過去で人気の動画 Best5 (過去90日) 第1位:ネイピア数の定義式 th-cam.com/video/ViZkXxkoUfA/w-d-xo.html 第2位:ロジスティック曲線とロジスティック方程式 th...
【#DBスキャン で #クラスタリング】データが密集している部分を1つのグループと見なす、という考え方に基づいたクラスタリング。#統計学 #機械学習 #わかりみサイエンス
มุมมอง 135หลายเดือนก่อน
DBスキャン(Density-Based Spatial Clustering of Applications with Noise)は、機械学習の教師なし学習におけるクラスタリングのアルゴリズムの一種で、データが密集している部分を1つのグループと見なす、という考え方に基づいたクラスタリングの方法です。これによって、形が不規則なグループや、外れた点(外れ値)を上手に分けることができます。PythonでDBスキャンを使って、簡単にクラスタリングを体感してみましょう。 00:00 イントロ 00:50 本日のコンテンツです 00:53 DBスキャンとは? 01:46 過去の動画 k-平均法によるクラスタリング th-cam.com/video/LFS-Cs7J_U0/w-d-xo.htmlsi=f73px0T500nTdhrb 02:40 パラメータとアルゴリズム 04:25 アルゴリズ...
【ロジスティック曲線とロジスティック方程式】ロジスティック曲線を描くロジスティック方程式を発見の歴史と式の証明を紹介します。#統計学 #機械学習 #ロジスティック #ツルマキマキ #わかりみサイエンス
มุมมอง 457หลายเดือนก่อน
統計学や機械学習で重要なロジスティック曲線は、生態学や人口動態学の分野で、限られた資源の下での集団の増加パターンを理解するために広く使われています。このロジスティック曲線をロジスティック方程式からもとめてみましょう。高校の数学で導出できます。 00:00 イントロ 00:08 ロジスティック曲線とは? 00:27 本日コンテンツです 00:31 1.ロジスティック曲線 01:35 2.マルサスモデル 03:14 3.ロジスティック方程式 06:31 4.ロジスティック関数 09:36 5.シグモイド関数との関係 10:45 関連動画 ロジット変換 11:48 わかりみサイエンス! ■関連動画 ロジット変換 th-cam.com/video/M1P3M5sjQjI/w-d-xo.htmlsi=dzXWuWLif8yHjynq ■わかりみサイエンス 過去で人気の動画 Best5 (過去9...
【 #異常検知 ホテリングのT^2】データが正規分布にしたがっている場合の異常検知T2シリーズ総集編です。 #統計学 #機械学習 #ホテリング #ツルマキマキ #わかりみサイエンス
มุมมอง 126หลายเดือนก่อน
ホテリングT^2(Tスクエア) 法は、多変量データの異常検知手法で、各サンプルのデータが平均からどれだけ離れているかを測る指標です。マハラノビス距離を基に、統計的に異常なサンプル(異常値)を検出します。 過去の動画を整理して総集編にしました。 00:00  イントロ 00:38 (その1) 1変数のマハラノビス距離 05:58 (その2) 1変数のホテリングの𝑇^2 13:40 (その3) 2変数のマハラノビス距離 21:02 (その4) 多変数の ホテリングの𝑇^2 26:53 わかりみサイエンス ■関連動画(個別の動画) 「異常検知ホテリングのT2 (その1)」【1変数のマハラノビス距離】 th-cam.com/video/jM3ooV0qOY0/w-d-xo.html 「異常検知ホテリングのT2 (その2)」【1変数のホテリングT2】 th-cam.com/video/bnAN...
【 #統計学】いろいろある正規性の検定。ChatGPTで検定結果を整理してみよう!? #正規分布 #ChatGPT #QQplot #わかりみサイエンス
มุมมอง 115หลายเดือนก่อน
Rを使っていろいろな正規性の検定を行って、その検定結果をChatGPTを使って一覧表にしてみましょう! 00:00 イントロ 00:27 正規性の検定に関する過去の動画の紹介 00:39 本日のコンテンツです 00:59 いろいろな、正規性の検定の概要 1.QQプロット (Quantile-Quantile Plot) 2.シャピロ・ウィルク検定 (Shapiro-Wilk Test) 3.コルモゴロフ・スミルノフ検定 (Kolmogorov-Smirnov Test) 4.アンダーソン・ダーリング検定 (Anderson-Darling Test) 5.ジャック-ベラ検定 (Jarque-Bera Test) 6.ダゴスティーノ検定 (D'Agostino's K-squared Test) 05:03 例題 06:34 ChatGPTで結果を整理 07:29 わかりみサイエンス ...
【 #機械学習 #決定木】タイタニックデーターを用いた決定木の紹介」です!教師なし学習の一種、アンサンブル学習中で、注目される決定木についてお話しします。統計学 #ツルマキマキ #わかりみサイエンス
มุมมอง 1722 หลายเดือนก่อน
今回は決定木についてお話しします。 それでは、さっそく、Rを使ってタイタニックデーターをもとに、決定木を実際に作成してみましょう 00:00 イントロ 00:20 本日のRのプログラムです! 00:29 本日のコンテンツ 00:33 1. パッケージのインストールと読み込み 01:01 2. タイタニックデータの準備 01:56 3. 決定木の作成 02:28 4. 決定木の表示 04:08 5. 出力された決定木の解釈 07:08 6. ジニ不純度 09:07 7. ジニ不純度のプロット 11:09 参考文献 11:19 わかりみサイエンス ! ■わかりみサイエンス 過去で人気の動画 Best5 (過去90日) 第1位:ネイピア数の定義式 th-cam.com/video/ViZkXxkoUfA/w-d-xo.html 第2位:MCMC法1 モンテカルロ法で積分を求める 統計ツール...
【クラスタ―型階層分析】教師なし学習の一種、階層型クラスター分析です。Rで簡単に体感してみましょう!#統計学 #機械学習 #ツルマキマキ #わかりみサイエンス
มุมมอง 1682 หลายเดือนก่อน
階層型クラスター分析を簡単に説明すると、データーをグループ分けする方法の一つです。 階層型クラスター分析は、特に、自然言語処理や画像解析、マーケティングのセグメンテーションなど、データーのグルーピングが重要な場面で利用されます。 Rで簡単にできるので、まずは、体感してみましょう! 00:00 イントロ 00:10 デンドログラム 00:25 基本的な考え方 01:36 例題です!Rを使って体感してみましょう! 05:03 出力結果の解釈です 05:44 わかりみサイエンス! ■わかりみサイエンス 過去で人気の動画 Best5 (過去90日) 第1位:ネイピア数の定義式 th-cam.com/video/ViZkXxkoUfA/w-d-xo.html 第2位: 統計学にでてくる自由度ってなにかしら? th-cam.com/video/T-YYyf9wATc/w-d-xo.htmlsi=...
【ポアソン分布(2/2) 定義式の証明】#統計学 #物理 #数学 #わかりみサイエンスポアソン分布に関して2回にわたってお届けします。その2ポアソン分布の定義式の証明です。
มุมมอง 1172 หลายเดือนก่อน
統計学に出てくるポアソン分布は、ある事象が一定の時間内に発生する回数を表す離散確率分布です。大事な確率分布の1つなので、このシリーズでマスターしましょう! 00:00 イントロ 00:20 ポアソン分布の定義 00:45 関連動画 確率変数の公式 th-cam.com/video/W-9U2P5sZjo/w-d-xo.html 00:59 ポアソン分布の定義式の証明 01:03 関連動画 反復試行の確率 th-cam.com/video/Ka1Xtg8LQW0/w-d-xo.html 01:54 関連動画 組み合わせの公式の証明 th-cam.com/video/57lxN_yH1wg/w-d-xo.htmlsi=XGpH8XK8pqT7yABQ 04:01 関連動画 ネイピア数の公式 th-cam.com/video/ViZkXxkoUfA/w-d-xo.htmlsi=jEWhmf...
【ポアソン分布(1/2) 定義と例題】ポアソン分布に関して2回にわたってお届けします。その1ポアソン分布の定義と例題。 #統計学 #物理 #数学 #わかりみサイエンス #ベイズ統計学
มุมมอง 1512 หลายเดือนก่อน
基礎をもう一度学びなおそう! 統計学に出てくるポアソン分布は、ある事象が一定の時間内に発生する回数を表す離散確率分布です。大事な確率分布の1つなので、このシリーズでマスターしましょう! 基礎をもう一度学びなおそう! 00:00 イントロ 00:24 ポアソン分布の定義 00:46 確率変数の公式の関連動画 th-cam.com/video/W-9U2P5sZjo/w-d-xo.html 01:00 例題 02:11 関連動画 ポアソン分布「馬にけられて死亡した兵士の数」 th-cam.com/video/-Cd_3Mv8Mo4/w-d-xo.html 02:22 関連動画 ポアソン分布「次の巨大地震が起こる確率は?」 th-cam.com/video/hpb-lGFARSQ/w-d-xo.html 02:33 次回の予告 02:47 わかりみサイエンス ■わかりみサイエンス 過去で人...
【ネイピア数の定義 】ネイピア数の定義式を簡単にもとめてみましょう!#統計学 #物理 #数学 #わかりみサイエンス
มุมมอง 5553 หลายเดือนก่อน
ネイピア数(または 自然対数の底)は、記号 𝑒 で表される無理数で、約2.71828 です。対数の研究で有名な数学者ジョン・ネイピアの名前をとって「ネイピア数」と呼ばれています。今回は、この定義式を証明したいと思います。 00:00 イントロ 00:17 ネイピア数の公式の可視化 00:44 定義式の証明 03:37 ネイピア数の関連動画「オイラーの公式と世界一美しい数式 th-cam.com/video/wYBtEMBrAkk/w-d-xo.htmlsi=8ZqjipIJ0wsBSnUb」 03:40 ネイピア数の関連動画「モンモールの問題(3/3)」 th-cam.com/video/Q6LKZ4PTfYA/w-d-xo.htmlsi=lP9oRSichuCBIZI9 03:49 ネイピア数の関連動画「オイラーの公式で波動方程式を導出する !」 th-cam.com/video/...
【 #統計学 】高校で学ぶ反復試行の確率を復習しましょう。#反復試行の確率 #数学 #二項分布 #わかりみサイエンス #数学
มุมมอง 1793 หลายเดือนก่อน
互いに独立な同じ試行をn回繰り返した時、ある事象がk回起こる確率を、反復試行の確率といいます。反復試行の確率で表現される確率分布を二項分布といいます。統計学の基礎の中の基礎です。わかりやすく解説するわね! 00:00 イントロ 00:20 本日のContentsです。 00:22 1.独立な試行の確率 00:50 順列と組み合わせ 02:47 反復試行の確率 04:00 ゴルトンボードで感じる二項分布と正規分布 th-cam.com/video/4Fx228xlfyE/w-d-xo.htmlsi=je_rxhFDjVX7-jLO 04:10 組み合わせの公式の証明 th-cam.com/video/4Fx228xlfyE/w-d-xo.htmlsi=je_rxhFDjVX7-jLO 04:22 わかりみサイエンス ! ■わかりみサイエンス 過去で人気の動画 Best5 (過去90日)...
【 #統計学 】複雑なデータにフィットする曲線を描きたい!  AICと決定係数、R2乗値を用いたモデルのあてはめに関してRで簡単に行える方法を紹介します。#AIC #わかりみサイエンス
มุมมอง 1393 หลายเดือนก่อน
【 #統計学 】複雑なデータにフィットする曲線を描きたい!  AICと決定係数、R2乗値を用いたモデルのあてはめに関してRで簡単に行える方法を紹介します。#AIC #わかりみサイエンス
【 #機械学習 】ガウス混合モデル(GMM) クラスタリングと異常検知 これは使える! R関数を使って簡単に機械学習してみよう! #統計学 #異常検知 #わかりみサイエンス #ツルマキマキ
มุมมอง 1743 หลายเดือนก่อน
【 #機械学習 】ガウス混合モデル(GMM) クラスタリングと異常検知 これは使える! R関数を使って簡単に機械学習してみよう! #統計学 #異常検知 #わかりみサイエンス #ツルマキマキ
【#統計学】統計学の対応のある2群の ノンパラメトリックな ウィルコクソンの符号付き順位検定 「効果があるのは、どちらの睡眠薬 ?」#検定 #わかりみサイエンス #ツルマキマキ
มุมมอง 1874 หลายเดือนก่อน
【#統計学】統計学の対応のある2群の ノンパラメトリックな ウィルコクソンの符号付き順位検定 「効果があるのは、どちらの睡眠薬 ?」#検定 #わかりみサイエンス #ツルマキマキ
【#統計学 の分類】統計学の全体を俯瞰してみよう!統計学といってもたくさんあります。統計学を大きく分類してみました。 #ベイズ統計学 #わかりみサイエンス #ツルマキマキ
มุมมอง 2734 หลายเดือนก่อน
【#統計学 の分類】統計学の全体を俯瞰してみよう!統計学といってもたくさんあります。統計学を大きく分類してみました。 #ベイズ統計学 #わかりみサイエンス #ツルマキマキ
【標本平均の標準偏差Uを考慮した標準誤差】(わかりみ #統計学 )推測統計学で用いる標本平均の標準誤差の解説です。 #標準偏差 #標準誤差 #わかりみサイエンス #ツルマキマキ
มุมมอง 934 หลายเดือนก่อน
【標本平均の標準偏差Uを考慮した標準誤差】(わかりみ #統計学 )推測統計学で用いる標本平均の標準誤差の解説です。 #標準偏差 #標準誤差 #わかりみサイエンス #ツルマキマキ
情報量と情報エントロピー】(わかりみ 機械学習 )#機械学習 #統計学 #情報量 #エントロピー #わかりみサイエンス #ツルマキマキ
มุมมอง 2284 หลายเดือนก่อน
情報量と情報エントロピー】(わかりみ 機械学習 )#機械学習 #統計学 #情報量 #エントロピー #わかりみサイエンス #ツルマキマキ
【(総集編) 単回帰分析の検出力とサンプルサイズの設計】(わかりみ #統計学 )4回のシリーズの総集編でお送りします! #統計学 #回帰分析 #わかりみサイエンス #ツルマキマキ
มุมมอง 1064 หลายเดือนก่อน
【(総集編) 単回帰分析の検出力とサンプルサイズの設計】(わかりみ #統計学 )4回のシリーズの総集編でお送りします! #統計学 #回帰分析 #わかりみサイエンス #ツルマキマキ
【#ベイズ統計学 有名な3人の囚人の問題】ベイズ統計学の例題で有名な3人の囚人。モンティ・ホール問題と比較してみましょう。#MCMC #統計学 #わかりみサイエンス #ツルマキマキ
มุมมอง 1945 หลายเดือนก่อน
【#ベイズ統計学 有名な3人の囚人の問題】ベイズ統計学の例題で有名な3人の囚人。モンティ・ホール問題と比較してみましょう。#MCMC #統計学 #わかりみサイエンス #ツルマキマキ
【ベイズ統計学の歴史とベイズの定理】 ベイズ統計学の歴史とベイズの定理のわかりみ!  #ベイズ統計学 #統計学 #わかりみサイエンス #ツルマキマキ
มุมมอง 1405 หลายเดือนก่อน
【ベイズ統計学の歴史とベイズの定理】 ベイズ統計学の歴史とベイズの定理のわかりみ!  #ベイズ統計学 #統計学 #わかりみサイエンス #ツルマキマキ
【ベイズ統計学3つの推定法(総集編)】MCMC法理解の補足のために3つの推定法を解説します。#MCMC #ベイズ統計学 #わかりみサイエンス #ツルマキマキ
มุมมอง 5525 หลายเดือนก่อน
【ベイズ統計学3つの推定法(総集編)】MCMC法理解の補足のために3つの推定法を解説します。#MCMC #ベイズ統計学 #わかりみサイエンス #ツルマキマキ
【 ワン・クラス・サポートベクターマシン (one-class-SVM)で簡単な異常検知】 #統計学 #機械学習 #サポートベクターマシン #わかりみサイエンス #
มุมมอง 1795 หลายเดือนก่อน
【 ワン・クラス・サポートベクターマシン (one-class-SVM)で簡単な異常検知】 #統計学 #機械学習 #サポートベクターマシン #わかりみサイエンス #
【 (総集編) 重回帰におけるAICとステップワイズ法】 #統計学 #重回帰 #AIC #わかりみサイエンス #ツルマキマキ重回帰における回帰係数をAICとステップワイズ法で簡単に最適化できます!
มุมมอง 3026 หลายเดือนก่อน
【 (総集編) 重回帰におけるAICとステップワイズ法】 #統計学 #重回帰 #AIC #わかりみサイエンス #ツルマキマキ重回帰における回帰係数をAICとステップワイズ法で簡単に最適化できます!
【 #コレログラム】 #統計学 #相関 #わかりみサイエンス #ツルマキマキ1)自己相関係数、2)偏自己相関係数
มุมมอง 3546 หลายเดือนก่อน
【 #コレログラム】 #統計学 #相関 #わかりみサイエンス #ツルマキマキ1)自己相関係数、2)偏自己相関係数
【相関分析(総集編)】基礎統計学 相関分析シリーズの総集編。相関分析に関して、5部形式にまとめてみました。#統計学 #わかりみサイエンス #ツルマキマキ #相関係数
มุมมอง 2386 หลายเดือนก่อน
【相関分析(総集編)】基礎統計学 相関分析シリーズの総集編。相関分析に関して、5部形式にまとめてみました。#統計学 #わかりみサイエンス #ツルマキマキ #相関係数
【 #確率変数 ((4+1)/4) 分散と共分散の公式】 #統計学 #数学 #わかりみサイエンス #ツルマキマキ
มุมมอง 1026 หลายเดือนก่อน
【 #確率変数 ((4 1)/4) 分散と共分散の公式】 #統計学 #数学 #わかりみサイエンス #ツルマキマキ

ความคิดเห็น

  • @EastWood19802
    @EastWood19802 4 วันที่ผ่านมา

    ◎Rのプログラム # 1. 学習データの定義 X <- c(1:20) # 入力データ:欠陥数 Y <- c(rep(0, 10), rep(1, 10)) # クラスデータ:正常(0)と異常(1) # 2. ロジスティック関数の初期パラメータ a <- 0 # 傾き b <- 0 # 切片 # 3. ロジスティック関数の式 sigmoid <- function(z) { 1 / (1 + exp(-z)) } hypothesis <- function(X, a, b) { sigmoid(a * X + b) } # 4. 交差エントロピー損失関数J loss_function <- function(X, Y, a, b) { m <- length(X) # データの総数 h <- hypothesis(X, a, b) # ロジスティック関数の計算 J <- -(1 / m) * sum(Y * log(h) + (1 - Y) * log(1 - h)) return(J) } # 5. 勾配降下法によるパラメータ更新 iterations <- 100000 nabla <- 0.01 loss_history <- numeric(iterations) for (i in 1:iterations) { h <- hypothesis(X, a, b) a <- a - (nabla / length(X)) * sum((h - Y) * X) b <- b - (nabla / length(X)) * sum(h - Y) loss_history[i] <- loss_function(X, Y, a, b) } # 6. 最終パラメータの結果 cat(sprintf("Final parameters: a = %.2f, b = %.2f ", round(a, 2), round(b, 2))) # 7. 損失関数と回帰曲線のプロット par(mfrow = c(1, 2)) # プロットを1行2列に設定 # 損失関数のプロット plot(loss_history, type = "l", xlab = "反復回数 iterations ", ylab = "交差エントロピー損失関数 J の値", main = "損失関数の推移") # 回帰曲線のプロット plot(X, Y, pch = 19, xlab = "欠陥数 X", ylab = "クラス Y", main = "ロジスティック回帰") # 回帰曲線の描画 X_plot <- seq(min(X), max(X), length.out = 100) y_plot <- hypothesis(X_plot, a, b) lines(X_plot, y_plot, col = "orange", lwd = 2) # 回帰曲線のプロット plot(X, Y, pch = 19, xlab = "欠陥数", ylab = "クラス", main = "ロジスティック回帰") # 回帰曲線の描画 X_plot <- seq(min(X), max(X), length.out = 100) y_plot <- hypothesis(X_plot, a, b) lines(X_plot, y_plot, col = "orange", lwd = 2) # 8. 新しいデータに対するクラスの予測 x_new <- 25 h_new <- hypothesis(x_new, a, b) cat(sprintf("新しいデータに対する確率: %.4f ", h_new)) cat(sprintf("欠陥製品の数が%d個の生産工程は%sです ", x_new, ifelse(h_new >= 0.5, "異常", "正常")))

  • @JK-FX-kd4yv
    @JK-FX-kd4yv 17 วันที่ผ่านมา

    わかりみサイエンスさん、丁寧なご返答ありがとうございます。 私は、今、FXのトレーダー(職業兼趣味)をしています。FXと言うのは為替取引(通貨を売買)で、トレーダーは、安値で買い、高値で売って利益を出します。 一般的には、「上がると予想して買う」というギャンブル性を伴う取引をしています。 私は、数独等の数学的(?)ゲームが好きで、特に、確率計画法的な、対戦相手のある最適化問題が好きです。 その流れで、為替を、対戦ゲームと見なし、「為替取引」を「対戦ゲームの最適化」だと考えて取引しています。 未来の為替レート(数値)の予想はできないが、過去のデータから、最適解を探しています。 ご回答にあった「実務的な課題」という点で言えば、最大の、重要な、関心の高い課題だと思いませんか? 一緒に、最適解を算出しませんか?

  • @takh2914
    @takh2914 23 วันที่ผ่านมา

    地震の発生分布はべき乗分布している事が知られています。今度は、正規分布をベースにしたポアソン分布ではなく、べき乗分布での地震の発生確率に関する動画を期待しています。

  • @JK-FX-kd4yv
    @JK-FX-kd4yv 23 วันที่ผ่านมา

    わかりみサイエンスさんは、「データの解析」だけではなく、「解析するデータの取り込み」についても知識が御有りなのですか? 理論ではなく、生データ(現実のデータ)を解析するための知識です。(私は素人なので、質問が解りにくいと思いますが)。 本人は知らなくても、優秀な知人が沢山おられるとか。

    • @EastWood19802
      @EastWood19802 18 วันที่ผ่านมา

      私は、実務の中で、データの解析だけでなく、生データを取り込むプロセスにも一定の知識を持っています。例えば、センサーやアンケートからのデータ収集方法、データの前処理(クリーニングやフォーマット調整)などにも経験があります。理論的な解析手法だけでなく、現実のデータを扱う際の実務的な課題にも対応できるよう努めています。一方で、生データの取り込みに関しては専門的な知識を持つ方々と連携したり、その分野について少しずつ学びながら対応しています。本動画集で、共に学ぶコミュニティーを作っています。現実のデータを扱う際には課題が多いですが、これらの動画をネタに専門知識を持つ方々と連携することで、うまく対応できています。質問ありがとうございます!

  • @kisidakisi
    @kisidakisi 24 วันที่ผ่านมา

    正直可愛い女の子にわかりやすく教えてもらえるの超嬉しい

    • @EastWood19802
      @EastWood19802 18 วันที่ผ่านมา

      応援のコメントありがとうございます!元気が出ます!

  • @EastWood19802
    @EastWood19802 26 วันที่ผ่านมา

    ◎Rプログラム # 成功率データ x <- c(1.05, 1.02, 0.98, 1.03, 1.04) # 相乗平均の計算と表示 print(m <- prod(x)^(1 / length(x)))

  • @EastWood19802
    @EastWood19802 หลายเดือนก่อน

    ◎R # パラメータの設定 lambda <- 11 # 到着率 (人/時間) t <- 1 / 12 # 時間 (時間単位) # 累積分布関数を使って計算 probability <- pexp(t, rate = lambda) # 結果の表示 cat("次の客が来るまでの時間が1/12時間以内である確率は", round(probability, 4), "です。 ")

  • @ふかずちゃんfukazu
    @ふかずちゃんfukazu หลายเดือนก่อน

    とてもわかりやすかったです! ゆかりちゃんかわえ🥳

    • @EastWood19802
      @EastWood19802 28 วันที่ผ่านมา

      応援ありがとう。嬉しい!

  • @EastWood19802
    @EastWood19802 หลายเดือนก่อน

    ◎ Python from sklearn.datasets import make_blobs from sklearn.preprocessing import StandardScaler from sklearn.cluster import DBSCAN import matplotlib.pyplot as plt # データを生成 centers = [[2, 1], [0, 0], [-2, 2], [-2, -2]] x, _ = make_blobs(n_samples=300, centers=centers, cluster_std=0.4) # データの標準化 x = StandardScaler().fit_transform(x) # DBSCANの実行 db = DBSCAN(eps=0.3, min_samples=25) labels = db.fit_predict(x) # クラスタリング結果をプロット plt.figure(figsize=(8, 6)) plt.scatter(x[:, 0], x[:, 1], c=labels, cmap='viridis', s=30) plt.title('DBSCAN Clustering Results') plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.colorbar(label='Cluster Label') plt.show()

  • @crowold3025
    @crowold3025 หลายเดือนก่อน

    今世紀、世界をパニックに陥れたコロナウィルスもこの関数のグラフで説明できると思う。つまりコロナウィルスの生存と繁殖の時系列だ。初期は強毒だが感染力は低い。何故なら宿主がすぐに死んでしまうからだ。しかしウィルスは自らの生存のため変異を繰り返す。少し弱毒化すると宿主の死ぬまでの時間が延び、あるいは死なない宿主が徐々に増えていくので、今度は爆発的に感染しコロナウィルスは増加していく。しかし同時に弱毒化も進行する。やがてほぼ人類がコロナウィルスに感染するとウィルスはかなり弱毒化して終焉を迎える。  しかしこの関数は人類の人口爆発にも当てはまるのではないか?爆発的に増加した人類は多くの人類以外の野生動物を絶

    • @EastWood19802
      @EastWood19802 18 วันที่ผ่านมา

      コメントありがとうございます!まだまだ世の中わからないことだらけです。

  • @EastWood19802
    @EastWood19802 หลายเดือนก่อน

    # ロジスティックシグモイド関数 # パラメータの定義 K <- 1 # 最大値 N0 <- 0.5 # 初期値 r <- 1 # 成長率 # ロジスティック関数の定義 logistic <- function(x) { K / (1 + ((K / N0) - 1) * exp(-r * x)) } # xの範囲を設定 x_values <- seq(-10, 10, length.out = 100) # ロジスティック関数を適用してyの値を計算 y_values <- logistic(x_values) # グラフの描画 plot(x_values, y_values, type = "l", col = "blue", lwd = 2, xlab = "y", ylab = "p", main = "Logistic Sigmoid Curve", cex.axis = 1.5, cex.lab = 2, cex.main = 2.5) # 軸の線を追加 abline(h = 0, col = "red", lty = 3, lwd = 3) abline(h = K, col = "red", lty = 3, lwd = 3)

  • @EastWood19802
    @EastWood19802 หลายเดือนก่อน

    # 個多数増加率の変化 # パラメータを設定 K <- 100 # 環境収容力 r <- 0.5 # 内的自然増加率の初期値 # 個体数の範囲を設定 population <- seq(0, K, length.out = 100) # 実効増加率を計算 effective_growth_rate <- r * (1 - population / K) # グラフの描画 plot(population, effective_growth_rate, type = "l", col = "blue", lwd = 2, xlab = "個体数 (N)", ylab = "個体数増加率 (m)", main = "ロジスティックモデルにおける個体数増加率 m の変化") # 環境収容力の線を追加 abline(v = 0, col = "red", lty = 2) abline(v = K, col = "red", lty = 2)

  • @EastWood19802
    @EastWood19802 หลายเดือนก่อน

    # マルサスモデル # パラメータの設定 No <- 1 m <- 0.5 C <- 0 # 時間tの範囲 t <- seq(0, 20, by = 0.1) # マルサスモデルの計算 N <- No * exp(m * t) + C # グラフの描画 plot(t, N, type = "l", col = "blue", lwd = 2, ylim = c(0, 100), xlab = "Time (t)", ylab = "Population (N)", main = "Malthusian Growth Model") # y = 0 の赤い点線 abline(h = 0, col = "red", lty = 2)

  • @EastWood19802
    @EastWood19802 หลายเดือนก่อน

    # ロジスティック曲線の定義 N <- function(t, K, N0, r) { K / (1 + ((K /N0- 1) ) * exp(-r * t)) } # 時間の範囲を設定 time <- seq(0, 20, length.out = 100) # パラメータの設定 K <- 100 # 環境収容力 N0 <- 1 # 初期個体数 r <- 0.5 # 内的自然増加率 # ロジスティック曲線を計算 population <- N(time, K, N0, r) # グラフの描画 plot(time, population, type = "l", col = "blue", lwd = 2, xlab = "時間の経過(t)", ylab = "個体の数(N(t))", main = "ロジスティック曲線") # 水平線を追加 abline(h = K, col = "red", lty = 2) abline(h = 0, col = "red", lty = 2) # グラフに注釈を追加 # text(15, K + 5, labels = "Carrying Capacity (K)", col = "red")

  • @EastWood19802
    @EastWood19802 หลายเดือนก่อน

    ◎Rのプログラム 00:38 (その1) 1変数のマハラノビス距離 # 必要なパッケージをチェックし、インストールと読み込みを実行 if (!requireNamespace("mvtnorm", quietly = TRUE)) { install.packages("mvtnorm") } library(mvtnorm) # パラメータ設定: 共分散行列とデータ生成 sigma.P <- matrix(c(1^2, 0, 0, 1^2), ncol = 2) # Group Pの共分散行列 sigma.Q <- matrix(c(3^2, 0, 0, 1^2), ncol = 2) # Group Qの共分散行列 # 乱数生成: 各グループのデータ rand.P <- rmvnorm(n = 6000, mean = c(5, 15), sigma.P) # Group P rand.Q <- rmvnorm(n = 6000, mean = c(11, 15), sigma.Q) # Group Q # x, y座標に分解 x.P <- rand.P[, 1] y.P <- rand.P[, 2] x.Q <- rand.Q[, 1] y.Q <- rand.Q[, 2] # グラフの設定 par(mar = c(5.5, 6.0, 4.1, 2)) # 余白設定 par(mgp = c(4, 1.2, 0)) # ラベルと軸の間隔設定 # 空のプロットを作成 plot(0, 0, type = "n", xlim = c(0, max(x.P, x.Q)), ylim = c(0, max(y.P, y.Q)), main = "1変数のマハラノビス距離", xlab = "x", ylab = "y", cex.main = 2, cex.lab = 2, cex.axis = 2) # データポイントの描画 points(x.P, y.P, col = "red", pch = 1) # Group P(赤丸) points(x.Q, y.Q, col = "blue", pch = 3) # Group Q(青×) # 凡例を追加 legend(x = "right", y = "center", legend = c("Group P", "Group Q"), pch = c(1, 3), col = c("red", "blue"), cex = 2, pt.cex = 2, bty = "n") # 分布曲線を描画 par(new = TRUE) curve(25 * dnorm(x, 5, 1), 0, max(x.P, x.Q), add = TRUE, col = "red", lwd = 4) # Group Pの分布曲線 par(new = TRUE) curve(25 * dnorm(x, 11, 3), 0, max(x.P, x.Q), add = TRUE, col = "blue", lwd = 4) # Group Qの分布曲線 # 分布の境界線を追加 abline(v = 8, lwd = 4, lty = 3) # 境界線(x = 8)   05:58 (その2) 1変数のホテリングの𝑇^2 # 必要なパッケージをチェックし、インストールと読み込みを実行 if (!requireNamespace("car", quietly = TRUE)) { install.packages("car") } library(car) # データの先頭15行を表示 head(Davis, n = 15) # 重量のヒストグラム作成 h <- hist(Davis$weight, xlim = c(20, 180), # 横軸の範囲 breaks = 10) # 階級数 # 標本平均の計算 mu <- mean(Davis$weight) # 標本分散 S^2 の計算 s2 <- mean((Davis$weight - mu)^2) # 平均と分散を表示 c(mu, s2) # 異常度の計算 a <- (Davis$weight - mu)^2 / s2 # カイ二乗分布による1%水準の閾値 th <- qchisq(0.99, df = 1) # 自由度1のカイ二乗分布 # 異常度のプロット plot(a, type = "h", # 縦棒スタイルでプロット main = "異常度のプロット", xlab = "観測番号", ylab = "異常度", col = "blue") # 閾値の水平線を追加 abline(h = th, col = "red", lwd = 2, lty = 2)   13:40 (その3) 2変数のマハラノビス距離 # 必要なパッケージのチェックとインストール if (!requireNamespace("MASS", quietly = TRUE)) { install.packages("MASS") } # 必要なライブラリを読み込む library(MASS) # --- グループP --- # 平均ベクトル(2次元上の中心) x_bar <- 3 y_bar <- 4 m <- c(x_bar, y_bar) # 平均ベクトル m # 分散共分散行列 v_x <- 9 v_xy <- 7 v_yx <- 7 v_y <- 6 v <- matrix(c(v_x, v_xy, v_yx, v_y), 2, 2) # 分散共分散行列 v # データポイント data <- c(5, 7) # マハラノビス距離の計算 distance_p <- sqrt(mahalanobis(data, m, v)) cat("グループPのマハラノビス距離:", distance_p, " ") # --- グループQ --- # 平均ベクトル(2次元上の中心) x_bar <- 8 y_bar <- 11 m <- c(x_bar, y_bar) # 平均ベクトル m # 分散共分散行列 v_x <- 7 v_xy <- 6 v_yx <- 6 v_y <- 8 v <- matrix(c(v_x, v_xy, v_yx, v_y), 2, 2) # 分散共分散行列 v # データポイント data <- c(5, 7) # マハラノビス距離の計算 distance_q <- sqrt(mahalanobis(data, m, v)) cat("グループQのマハラノビス距離:", distance_q, " ")   21:02 (その4) 多変数の ホテリングの𝑇^2 # 必要なパッケージのチェックとインストール if (!requireNamespace("car", quietly = TRUE)) { install.packages("car") } if (!requireNamespace("MASS", quietly = TRUE)) { install.packages("MASS") } # ライブラリの読み込み library(car) library(MASS) # --- 1. 観測値の準備 --- # Davisデータセットの読み込みと散布図の作成 head(Davis, n = 15) # データの先頭15行を表示 X <- cbind(Davis$weight, Davis$height) # 体重と身長のデータを結合 par(mar = c(5.5, 6.0, 4.1, 2), mgp = c(4, 1.2, 0)) # グラフの余白と軸設定 plot( X[, 1], X[, 2], pch = 16, xlab = "weight", ylab = "height", cex.lab = 2, cex.axis = 1.5, lwd = 4 ) # 散布図 # グラフ間に新しいウィンドウを生成 dev.new() # --- 2. 分布の推定 --- # 平均ベクトルの計算 (mx <- colMeans(X)) # 平均ベクトル # 分散共分散行列の計算 Xc <- X - matrix(1, nrow(X), 1) %*% mx # 平均を引いたデータ (Sx <- t(Xc) %*% Xc / nrow(X)) # 分散共分散行列 # --- 3. 異常度の算出 --- a <- mahalanobis(X, mx, Sx) # マハラノビス距離(異常度) # --- 4. 閾値の設定 --- th <- qchisq(0.99, 2) # 自由度2のカイ2乗分布による1%水準の閾値 # --- 5. 異常度プロット --- plot( a, xlab = "Index", ylab = "Anomaly Score", cex.lab = 2, cex.axis = 2, lwd = 4, ylim = c(0, max(a, th)) ) # 異常度のプロット lines(0:length(a), rep(th, length(a) + 1), col = "red", lty = 2, lwd = 4) # 閾値線

  • @EastWood19802
    @EastWood19802 หลายเดือนก่อน

    ◎Rのプログラム(改良版) # 必要なパッケージをチェックし、インストールと読み込みを実行 if (!requireNamespace("car", quietly = TRUE)) { install.packages("car") } library(car) # データの先頭15行を表示 head(Davis, n = 15) # 重量のヒストグラム作成 h <- hist(Davis$weight, xlim = c(20, 180), # 横軸の範囲 breaks = 10) # 階級数 # 標本平均の計算 mu <- mean(Davis$weight) # 標本分散 S^2 の計算 s2 <- mean((Davis$weight - mu)^2) # 平均と分散を表示 c(mu, s2) # 異常度の計算 a <- (Davis$weight - mu)^2 / s2 # カイ二乗分布による1%水準の閾値 th <- qchisq(0.99, df = 1) # 自由度1のカイ二乗分布 # 異常度のプロット plot(a, type = "h", # 縦棒スタイルでプロット main = "異常度のプロット", xlab = "観測番号", ylab = "異常度", col = "blue") # 閾値の水平線を追加 abline(h = th, col = "red", lwd = 2, lty = 2)

  • @EastWood19802
    @EastWood19802 หลายเดือนก่อน

    ◎Rのプログラム # install.packages("mvtnorm") library(mvtnorm) sigma.P = matrix(c(1^2, 0, 0, 1^2), ncol = 2) sigma.Q = matrix(c(3^2, 0, 0, 1^2), ncol = 2) rand.P = rmvnorm(n = 6000, mean = c(5, 15), sigma.P) rand.Q = rmvnorm(n = 6000, mean = c(11, 15), sigma.Q) x.P = rand.P[, 1] y.P = rand.P[, 2] x.Q = rand.Q[, 1] y.Q = rand.Q[, 2] # グラフの枠の設定 par(mar = c(5.5, 6.0, 4.1, 2)) par(mgp = c(4, 1.2, 0)) plot(0, 0, type = "n", xlim = c(0, max(x.P, x.Q)), ylim = c(0, max(y.P, y.Q)), main = "1変数のマハラノビス距離", xlab = "x", ylab = "y", cex.main = 2, cex.lab = 2, cex.axis = 2) points(x.P, y.P, col = "red", pch = 1) points(x.Q, y.Q, col = "blue", pch = 3) legend(x="right", y="center", legend = c("Group P", "Group Q"), pch = c(1, 3), col = c("red", "blue"), cex = 2, pt.cex=2, bty="n") par(new=T) curve(25*dnorm(x,5,1),0,max(x.P, x.Q), add=TRUE, col = "red", lwd=4) par(new=T) curve(25*dnorm(x,11,3),0,max(x.P, x.Q), add=TRUE, col = "blue", lwd=4) abline(v=8, lwd=4, lty=3)

  • @EastWood19802
    @EastWood19802 2 หลายเดือนก่อน

    ◎Rのプログラム # 必要なライブラリのインストールと読み込み # 初めての実行時はコメントを外してください # install.packages("nortest") # install.packages("tseries") # install.packages("moments") library(nortest) library(tseries) library(moments) # 1. データの生成とデータの可視化 set.seed(123) data_normal <- rnorm(100, mean = 0, sd = 1) data_non_normal <- runif(100, min = 0, max = 1) par(mfrow = c(2, 2)) # 2行2列のプロット領域を作成 # 正規分布に従うデータのヒストグラム hist(data_normal, breaks = 20, probability = TRUE, main = "Histogram of Normal Data", col = "lightblue") curve(dnorm(x, mean = mean(data_normal), sd = sd(data_normal)), add = TRUE, col = "red", lwd = 2) # 正規分布に従わないデータのヒストグラム hist(data_non_normal, breaks = 20, probability = TRUE, main = "Histogram of Non-Normal Data", col = "lightgreen") # 正規分布に従うデータのQQプロット qqnorm(data_normal, main = "QQ Plot for Normal Data") qqline(data_normal, col = "blue", lwd = 2) # 正規分布に従わないデータのQQプロット qqnorm(data_non_normal, main = "QQ Plot for Non-Normal Data") qqline(data_non_normal, col = "red", lwd = 2) par(mfrow = c(1, 1)) # プロット領域を1つに戻す # 2. シャピロ・ウィルク検定の実施 shapiro_test_normal <- shapiro.test(data_normal) shapiro_test_non_normal <- shapiro.test(data_non_normal) # 3. コルモゴロフ・スミルノフ検定の実施 ks_test_normal <- ks.test(data_normal, "pnorm", mean = 0, sd = 1) ks_test_non_normal <- ks.test(data_non_normal, "punif", min = 0, max = 1) # 4. アンダーソン・ダーリング検定の実施 ad_test_normal <- ad.test(data_normal) ad_test_non_normal <- ad.test(data_non_normal) # 5. ジャック-ベラ検定の実施 jb_test_normal <- jarque.bera.test(data_normal) jb_test_non_normal <- jarque.bera.test(data_non_normal) # 6. 結果の表示 print("正規分布に従うデータのシャピロ・ウィルク検定結果") print(shapiro_test_normal) print("正規分布に従わないデータのシャピロ・ウィルク検定結果") print(shapiro_test_non_normal) print("正規分布に従うデータのコルモゴロフ・スミルノフ検定結果") print(ks_test_normal) print("正規分布に従わないデータのコルモゴロフ・スミルノフ検定結果") print(ks_test_non_normal) print("正規分布に従うデータのアンダーソン・ダーリング検定結果") print(ad_test_normal) print("正規分布に従わないデータのアンダーソン・ダーリング検定結果") print(ad_test_non_normal) print("正規分布に従うデータのジャック-ベラ検定結果") print(jb_test_normal) print("正規分布に従わないデータのジャック-ベラ検定結果") print(jb_test_non_normal)

  • @EastWood19802
    @EastWood19802 2 หลายเดือนก่อน

    ◎ Rプログラム ## タイタニックデータによる決定木 # 必要なパッケージが未インストールの場合、インストールする if (!require("rpart")) { install.packages("rpart") } if (!require("rpart.plot")) { install.packages("rpart.plot") } # ライブラリの読み込み library(rpart) library(rpart.plot) # Titanicデータセットをデータフレーム形式に変換 data(Titanic) df <- data.frame(Titanic) df <- data.frame( Class = rep(df$Class, df$Freq), Sex = rep(df$Sex, df$Freq), Age = rep(df$Age, df$Freq), Survived = rep(df$Survived, df$Freq) ) # データの末尾10行を表示(変換前と変換後の比較) tail(data.frame(Titanic), 10) tail(df, 10) # 決定木モデルの構築 dtree <- rpart(Survived ~ Class + Sex + Age, data = df) # 決定木のプロット prp(dtree, type = 1, extra = 2) # 新しいデバイスを開く dev.new() # ジニ不純度を使用した決定木の生成 dtree <- rpart(Survived ~ Class + Sex + Age, data = df, parms = list(split = "gini")) # コスト複雑度パラメータ(cp)のグラフを描画 plotcp(dtree)   ### 表

  • @EastWood19802
    @EastWood19802 2 หลายเดือนก่อน

    # 必要なパッケージを読み込む library(datasets) # 1. データの準備 # 友達の趣味のデータを作成 friends_data <- data.frame( 名前 = c("アキラ", "ユカ", "ケンタ", "サトミ", "ショウ", "リョウ", "マイ", "ハル", "カナ", "ジュン"), ゲーム = c(8, 2, 9, 4, 7, 3, 5, 6, 1, 4), 読書 = c(5, 8, 2, 9, 3, 8, 7, 4, 6, 6), スポーツ = c(3, 6, 5, 2, 8, 7, 4, 9, 8, 7), 映画 = c(7, 3, 8, 6, 4, 2, 9, 5, 3, 4) ) # 2. データを標準化 friends_scaled <- scale(friends_data[, -1]) # 名前の列を除いて標準化 # 3. 距離を計算 dist_matrix <- dist(friends_scaled, method = "euclidean") # 4. クラスター分析でグループ化 hc <- hclust(dist_matrix, method = "ward.D2") # 5. グループの可視化 plot(hc, labels = friends_data$名前, main = "Dendrogram of Friends Grouping", xlab = "", sub = "", ylab = "Similarity (Distance)") # 6. 色を付けてグループ分け rect.hclust(hc, k = 3, border = 2:4)

  • @EastWood19802
    @EastWood19802 2 หลายเดือนก่อน

    03:30 下の k は、k=0,1,2,3,4,5 です。

  • @EastWood19802
    @EastWood19802 2 หลายเดือนก่อน

    わかりやすい内容にしたのでみほしいな!

  • @EastWood19802
    @EastWood19802 2 หลายเดือนก่อน

    import scipy.stats as stats # 平均欠陥数(λ) lambda_value = 3 # 欠陥が5つ以上発生する確率を求める P = 1 - stats.poisson.cdf(4, lambda_value) # 結果を表示 print(f"1日で欠陥が5つ以上発生する確率: {P:.4f}")

  • @EastWood19802
    @EastWood19802 2 หลายเดือนก่อน

    ◎ Rのプログラム # 平均欠陥数(λ) lambda <- 3 # 欠陥が5つ以上発生する確率を求める P <- 1 - ppois(4, lambda) # 結果を表示 cat("1日で欠陥が5つ以上発生する確率:", P, " ")

  • @EastWood19802
    @EastWood19802 3 หลายเดือนก่อน

    import numpy as np import matplotlib.pyplot as plt # 1プログラムの設定 x_values1 = np.arange(2, 101, 1) # xの範囲を2から100に設定 y_values1 = (1 + 1 / x_values1) ** x_values1 # 2プログラムの設定 x_values2 = np.arange(-2, -101, -1) # xの範囲を-2から-100に設定 y_values2 = (1 + 1 / x_values2) ** x_values2 # eの値 e_value = np.exp(1) # グラフの作成(1行2列のプロット) fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 6)) # 1プログラムのプロット ax1.plot(x_values1, y_values1, color='blue', linewidth=2, label='(1 + 1/x)^x') ax1.axhline(y=e_value, color='red', linestyle='--', linewidth=2, label='e') ax1.set_title('Graph of (1 + 1/x)^x for x > 0', fontsize=16) ax1.set_xlabel('x', fontsize=14) ax1.set_ylabel('(1 + 1/x)^x', fontsize=14) ax1.set_ylim(2, 3.5) # yスケールを2から3.5に設定 ax1.legend(fontsize=12) ax1.grid(True) # 2プログラムのプロット ax2.plot(x_values2, y_values2, color='blue', linewidth=2, label='(1 + 1/x)^x') ax2.axhline(y=e_value, color='red', linestyle='--', linewidth=2, label='e') ax2.set_title('Graph of (1 + 1/x)^x for x < 0', fontsize=16) ax2.set_xlabel('x', fontsize=14) ax2.set_ylabel('(1 + 1/x)^x', fontsize=14) ax2.set_ylim(2, 3.5) # yスケールを2から3.5に設定 ax2.legend(fontsize=12) ax2.grid(True) # グラフの描画 plt.tight_layout() plt.show()

  • @EastWood19802
    @EastWood19802 3 หลายเดือนก่อน

    動画、簡単すぎたかな?

  • @ひろはる-f4n
    @ひろはる-f4n 3 หลายเดือนก่อน

    音楽でかすぎ

    • @EastWood19802
      @EastWood19802 3 หลายเดือนก่อน

      コメントありがとうございます。BGMの音量、検討したいと思います。

  • @EastWood19802
    @EastWood19802 3 หลายเดือนก่อน

    ◎Rのプログラム # Pressure の散布図 library(ggplot2) ggplot(pressure, aes(x = temperature, y = pressure)) + geom_point() + geom_line() + ggtitle("Temperature vs Pressure") + xlab("Temperature (C)") + ylab("Pressure (mm Hg)") # 必要なライブラリの読み込み library(datasets)   ◎Rのプログラム # モデルの探索 # データの準備 T <- pressure$temperature + 273.15 # 絶対温度に変換 P <- pressure$pressure # モデルの定義とフィット model1 <- lm(P ~ T) model2 <- lm(P ~ log(T)) model3 <- lm(log(P) ~ T) model4 <- lm(log(P) ~ log(T)) model5 <- lm(log(P) ~ I(1/T)) # AICの計算 aic_model1 <- AIC(model1) aic_model2 <- AIC(model2) aic_model3 <- AIC(model3) aic_model4 <- AIC(model4) aic_model5 <- AIC(model5) # R²値の計算 r2_model1 <- summary(model1)$r.squared r2_model2 <- summary(model2)$r.squared r2_model3 <- summary(model3)$r.squared r2_model4 <- summary(model4)$r.squared r2_model5 <- summary(model5)$r.squared # 結果を表示 results <- data.frame( Model = c("model1: P = a + bT", "model2: P = a + b log(T)", "model3: log(P) = a + bT", "model4: log(P) = a + b log(T)", "model5: log(P) = a + b/T"), AIC = c(aic_model1, aic_model2, aic_model3, aic_model4, aic_model5), R_squared = c(r2_model1, r2_model2, r2_model3, r2_model4, r2_model5) ) print(results) # 散布図の描画 plot(1/T, log(P), main = "Scatter Plot of log(P) vs 1/T", xlab = "1/T (Inverse of Temperature)", ylab = "log(P) (Log of Pressure)", pch = 19, col = "blue") abline(model5, col = "red", lwd = 2) # モデル5のサマリの表示 model5_summary <- summary(model5) print(model5_summary) # 回帰式の導出 coefficients <- model5_summary$coefficients intercept <- coefficients[1, 1] slope <- coefficients[2, 1] cat("回帰式: log(P) =", intercept, "+", slope, "/T", " ")     ◎ Rプログラム # 多項式で近似したら? # データの準備 T <- pressure$temperature + 273.15 # 絶対温度に変換 P <- pressure$pressure # AICを計算するための関数を定義します calculate_aic <- function(degree) { model <- lm(P ~ poly(T, degree)) return(AIC(model)) } # 高次多項式の次数を1から順に増やして、AICを計算します degree <- 1 aic_value <- calculate_aic(degree) # AICが-56.81158以下になるまでループを続けます while(aic_value > -56.81158) { degree <- degree + 1 aic_value <- calculate_aic(degree) } # 最終的なモデルをフィットしてAICを出力します final_model <- lm(P ~ poly(T, degree)) final_aic <- AIC(final_model) # 結果を出力します cat("最適な多項式の次数:", degree, " ") cat("AIC:", final_aic, " ") # 最終的な回帰式の係数を取得 coefficients <- coef(final_model) cat("回帰式の係数: ") print(coefficients)

  • @EastWood19802
    @EastWood19802 3 หลายเดือนก่อน

    03:09 i=1 ⇒ k=1 です。

  • @EastWood19802
    @EastWood19802 3 หลายเดือนก่อน

    ◎ GMMクラスタリングで異常検知 library(mclust) library(car) # データの準備 X <- Davis[-12, c("weight" , "height")] # GMMによるクラスタリングの実行 result <- Mclust(X) # 混合比を取り出す pi <- result$parameters$pro # 元のデータセットの再取得 X <- Davis[, c("weight" , "height")] # クラスタごとの正規分布の確率密度を計算 XX <- cdens(modelName = result$modelName, data = X, parameters = result$parameters) # 異常度を計算 a <- -log(as.matrix(XX) %*% as.matrix(pi)) # 異常度のプロット plot(a, type = "b", col = "blue", pch = 19, xlab = "Sample number", ylab = "Anomaly score", main = "Anomaly Score")

  • @EastWood19802
    @EastWood19802 3 หลายเดือนก่อน

    ◎GMMでクラスタリング # 必要なパッケージの読み込み library(car) library(mclust) # 観測データを取得 X <- Davis[-12, c("weight", "height")] # Mclust関数を使って最適なモデルを選択 model <- Mclust(X) # BICで最適なコンポーネント数を取得 best_model <- model$G cat("BICが最小となるコンポーネント数:", best_model, " ") # 選択されたモデルの概要を出力 print(summary(model, parameters=TRUE)) # 結果のプロット plot(model)

  • @EastWood19802
    @EastWood19802 4 หลายเดือนก่อน

    # Rのプログラム # 正規性の検定(QQ プロット) # グループ1とグループ2のデータを抽出 group1 <- sleep$extra[sleep$group == 1]  group2 <- sleep$extra[sleep$group == 2] sleep # 対になるデータの差を計算 diff <- group1 - group2 # グラフを1行2列に設定 par(mfrow = c(1, 2)) # 差のヒストグラムをプロット hist(diff, main = "Difference between Group1 and Group2", xlab = "Difference (Group1 - Group2)", col = "lightblue", border = "black") # 差のQQプロットをプロット qqnorm(diff, main = "QQ Plot of Differences", col = "blue") qqline(diff, col = "red", lwd = 2) # 理論的な正規分布線を追加   # データセット sleep の group 列に基づいてグループ1とグループ2の extra データを抽出 group1 <- sleep$extra[sleep$group == 1] group2 <- sleep$extra[sleep$group == 2] # ウィルコクソンの符号付き順位検定を実行(近似的なp値を使用) test_result <- wilcox.test(group1, group2, paired = FALSE, exact = FALSE) # 検定結果を表示 print(test_result)

  • @EastWood19802
    @EastWood19802 4 หลายเดือนก่อน

    わかりみサイエンスの原点にもどって、わかりやすくまとめてみました!

  • @EastWood19802
    @EastWood19802 4 หลายเดือนก่อน

    # ガンマ関数 n=0:5 factorial = gamma(n+1) data.frame(n, factorial) # 補正係数 library(gt) n <- 2:10 c=function(n){ return(sqrt((n-1)/2)*gamma((n-1)/2)/(gamma(n/2))) } cn=c(n) options(digits = 3) data.frame(n, cn) %>% gt()

  • @EastWood19802
    @EastWood19802 4 หลายเดือนก่อน

    08:48 の式の最後 (1-9)log2p ⇒ (1-9)log2(1-p) です。Rのプログラムはあっています。

  • @EastWood19802
    @EastWood19802 4 หลายเดือนก่อน

    # Rのプログラム # 必要なライブラリを読み込む library(ggplot2) # pの値を0から1まで0.01刻みで生成 p_values <- seq(0.01, 0.99, by = 0.01) # 0と1を除外 # エントロピーを計算 entropy_values <- -p_values * log2(p_values) - (1 - p_values) * log2(1 - p_values) # データフレームを作成 data <- data.frame(p = p_values, entropy = entropy_values) # グラフを描画 ggplot(data, aes(x = p, y = entropy)) + geom_line(linewidth = 2.0) + labs(x = "確率 P", y = "情報エントロピー H", size = 20) + theme_minimal() + theme(text = element_text(size = 20)) + theme(axis.text.x = element_text(size = 20), axis.text.y = element_text(size = 20))

  • @EastWood19802
    @EastWood19802 5 หลายเดือนก่อน

    # Rのプログラム ###### (1) 単回帰の概要 # 00:01:02 # 表のRのプログラム # install.packages("Ecdat") # install.packages("gt") # パッケージの読み込み library(Ecdat) library(gt) # データの準備 N <- 1:30 Ice <- cbind(N, Icecream) head(Ice) # 必要な列の選択 Ice0 <- Ice[, c("N", "cons", "temp")] # データの分割 Ice1 <- Ice0[1:10, ] Ice2 <- Ice0[11:20, ] Ice3 <- Ice0[21:30, ] # データフレームの結合 tb <- data.frame(Ice1, Ice2, Ice3) # gt() を使ってきれいな表を作成 tb %>% gt() %>% tab_header( title = "Package of Icecreame", subtitle = "cons vs temp" ) %>% tab_source_note( source_note = md("1951年から1953年にアメリカで30回行われたアイスクリームの消費量 (消費量 vs 気温)") ) library(Ecdat) # 00:01:26 # Rで回帰分析 # install.packages("Ecdat") library(Ecdat) cons<-Icecream$cons ; cons temp<-Icecream$temp ; temp # 変数 x, yにデータを格納(コピペして汎用化するため) x <- temp      y <- cons # きれいな図を描くための設定 par(mar = c(5.5, 6.0, 4.1, 2)) par(mgp = c(4, 1.2, 0))   plot(x, y, xlab = "気温(temp)", ylab = "消費量(cons)", cex.lab = 2, cex.axis = 1.5, lwd = 4) # 散布図の描画 # 回帰分析表の出力 S_reg <- lm(y~x) summary(S_reg ) # 回帰直線の描画 abline(S_reg, lwd=4, lty=2, col="red") # 平均値の描画 mx = mean(x) my =mean(y) abline(v=mx, lwd=2) abline(h=my, lwd=2) ##### (2) 決定係数 # 00:12:00 # install.packages("Ecdat") library(Ecdat) x<-Icecream$temp y<-Icecream$cons # 回帰分析表の出力 S_reg <- lm(y~x) summary(S_reg)   ##### (3) 分散分析 # 00:17:40 library(Ecdat) y<-Icecream$cons x<-Icecream$temp S_reg <- lm(y~x) summary(S_reg ) R2 <- cor(x,y)^2 n<- length(x) (F0 <- R2/(1-R2)*(n-2)) (Fq<- qf(1-0.001, 1, n-2)) (p値<-pf(F0, 1, (n-2), lower.tail=FALSE)) # 00:18:04 # 例題で示した図 par(mar = c(5.5, 6.0, 4.1, 2)) par(mgp = c(4, 1.2, 0)) # packages <-c("Ecdat", "tidyverse") # install.packages(packages) library(Ecdat) y<-Icecream$cons x<-Icecream$temp R2 <- cor(x, y)^2 # 決定係数 n<- length(x) # サンプルサイズ # F分布 f1=1 ; f2=28  # 自由度 a=0.001 xmax=50 ymax=0.002 curve(df(x,1,28),0,xmax, xlab="F", ylab="df(F,1,28)", ylim=c(0, ymax),cex.lab = 2, cex.axis = 1.5, lwd = 4) # F値0~50 # F値 (F <- R2/(1-R2)*(n-2)) # 検定統計量 (up= qf(1-a, f1, f2)) # 棄却域境界の分位点 F(1,n-2)(0.1%有意水準) abline(v=up, lty=2, col="red", cex.lab = 2, cex.axis = 1.5, lwd = 4) abline(v=F, lty=2, col="blue",cex.lab = 2, cex.axis = 1.5, lwd = 4) # 色を塗る  xvals <- seq(up,xmax, length=2000) dvals <- df(xvals,f1,f2) polygon(c(xvals,rev(xvals)), c(rep(0,2000),rev(dvals)), col="skyblue") ##### (4) 検出力とサンプルサイズ # 00:21:32 # Retrieve Cohen's suggested effect sizes library("pwr") cohen.ES(test = "f2", size = "small") cohen.ES(test = "f2", size = "medium") cohen.ES(test = "f2", size = "large") # 00:21:59 f <- function(x){ a <- sqrt(x/(1+x)) return(a) } a1=f(0.02) ; a2=f(0.15) ; a3=f(0.35) a1<-paste0("小=", round(a1, 2)) a2<-paste0("中=", round(a2, 2)) a3<-paste0("大=", round(a3, 2)) c(a1, a2, a3) # 00:23:56 # Power=0.8 サンプルサイズ # install.packages("pwr") library (pwr) v= round(pwr.f2.test(u=1, f2=0.02, sig.level=0.05, power=0.8)$v, 1) paste0 ("v=" ,v) # 00:24:37 # Power=0.9 # サンプルサイズ library(pwr) a <- 0.05 po <- 0.9 f <- function(x) { a <- ceiling(pwr.f2.test(u = 1, f2 = x, sig.level = a, power = po)$v) + 2 return(a) } a1 <- f(0.02) a2 <- f(0.15) a3 <- f(0.35) a1 <- paste0("小(0.02)=", a1) a2 <- paste0("中(0.15)=", a2) a3 <- paste0("大(0.35)=", a3) c(a1, a2, a3)

  • @EastWood19802
    @EastWood19802 5 หลายเดือนก่อน

    # プログラム更新しました # (1) 単回帰の概要 # 表のRのプログラム # install.packages("Ecdat") # install.packages("gt") # パッケージの読み込み library(Ecdat) library(gt) # データの準備 N <- 1:30 Ice <- cbind(N, Icecream) head(Ice) # 必要な列の選択 Ice0 <- Ice[, c("N", "cons", "temp")] # データの分割 Ice1 <- Ice0[1:10, ] Ice2 <- Ice0[11:20, ] Ice3 <- Ice0[21:30, ] # データフレームの結合 tb <- data.frame(Ice1, Ice2, Ice3) # gt() を使ってきれいな表を作成 tb %>% gt() %>% tab_header( title = "Package of Icecreame", subtitle = "cons vs temp" ) %>% tab_source_note( source_note = md("1951年から1953年にアメリカで30回行われたアイスクリームの消費量 (消費量 vs 気温)") ) library(Ecdat) # Rで回帰分析 # install.packages("Ecdat") library(Ecdat) cons<-Icecream$cons ; cons temp<-Icecream$temp ; temp # 変数 x, yにデータを格納(コピペして汎用化するため) x <- temp      y <- cons # きれいな図を描くための設定 par(mar = c(5.5, 6.0, 4.1, 2)) par(mgp = c(4, 1.2, 0))   plot(x, y, xlab = "気温(temp)", ylab = "消費量(cons)", cex.lab = 2, cex.axis = 1.5, lwd = 4) # 散布図の描画 # 回帰分析表の出力 S_reg <- lm(y~x) summary(S_reg ) # 回帰直線の描画 abline(S_reg, lwd=4, lty=2, col="red") # 平均値の描画 mx = mean(x) my =mean(y) abline(v=mx, lwd=2) abline(h=my, lwd=2)

  • @EastWood19802
    @EastWood19802 5 หลายเดือนก่อน

    # プログラム更新しました # (1) 単回帰の概要 # 表のRのプログラム # install.packages("Ecdat") # install.packages("gt") # パッケージの読み込み library(Ecdat) library(gt) # データの準備 N <- 1:30 Ice <- cbind(N, Icecream) head(Ice) # 必要な列の選択 Ice0 <- Ice[, c("N", "cons", "temp")] # データの分割 Ice1 <- Ice0[1:10, ] Ice2 <- Ice0[11:20, ] Ice3 <- Ice0[21:30, ] # データフレームの結合 tb <- data.frame(Ice1, Ice2, Ice3) # gt() を使ってきれいな表を作成 tb %>% gt() %>% tab_header( title = "Package of Icecreame", subtitle = "cons vs temp" ) %>% tab_source_note( source_note = md("1951年から1953年にアメリカで30回行われたアイスクリームの消費量 (消費量 vs 気温)") ) library(Ecdat) # Rで回帰分析 # install.packages("Ecdat") library(Ecdat) cons<-Icecream$cons ; cons temp<-Icecream$temp ; temp # 変数 x, yにデータを格納(コピペして汎用化するため) x <- temp      y <- cons # きれいな図を描くための設定 par(mar = c(5.5, 6.0, 4.1, 2)) par(mgp = c(4, 1.2, 0))   plot(x, y, xlab = "気温(temp)", ylab = "消費量(cons)", cex.lab = 2, cex.axis = 1.5, lwd = 4) # 散布図の描画 # 回帰分析表の出力 S_reg <- lm(y~x) summary(S_reg ) # 回帰直線の描画 abline(S_reg, lwd=4, lty=2, col="red") # 平均値の描画 mx = mean(x) my =mean(y) abline(v=mx, lwd=2) abline(h=my, lwd=2)

  • @EastWood19802
    @EastWood19802 5 หลายเดือนก่อน

    # プログラム更新しました # (2) 決定係数 # install.packages("Ecdat") library(Ecdat) x<-Icecream$temp y<-Icecream$cons # 回帰分析表の出力 S_reg <- lm(y~x) summary(S_reg)

  • @EastWood19802
    @EastWood19802 5 หลายเดือนก่อน

    # プログラム更新しました # (3) 分散分析 library(Ecdat) y<-Icecream$cons x<-Icecream$temp S_reg <- lm(y~x) summary(S_reg ) R2 <- cor(x,y)^2 n<- length(x) (F0 <- R2/(1-R2)*(n-2)) (Fq<- qf(1-0.001, 1, n-2)) (p値<-pf(F0, 1, (n-2), lower.tail=FALSE)) # 例題で示した図 par(mar = c(5.5, 6.0, 4.1, 2)) par(mgp = c(4, 1.2, 0)) # packages <-c("Ecdat", "tidyverse") # install.packages(packages) library(Ecdat) y<-Icecream$cons x<-Icecream$temp R2 <- cor(x, y)^2 # 決定係数 n<- length(x) # サンプルサイズ # F分布 f1=1 ; f2=28  # 自由度 a=0.001 xmax=50 ymax=0.002 curve(df(x,1,28),0,xmax, xlab="F", ylab="df(F,1,28)", ylim=c(0, ymax),cex.lab = 2, cex.axis = 1.5, lwd = 4) # F値0~50 # F値 (F <- R2/(1-R2)*(n-2)) # 検定統計量 (up= qf(1-a, f1, f2)) # 棄却域境界の分位点 F(1,n-2)(0.1%有意水準) abline(v=up, lty=2, col="red", cex.lab = 2, cex.axis = 1.5, lwd = 4) abline(v=F, lty=2, col="blue",cex.lab = 2, cex.axis = 1.5, lwd = 4) # 色を塗る  xvals <- seq(up,xmax, length=2000) dvals <- df(xvals,f1,f2) polygon(c(xvals,rev(xvals)), c(rep(0,2000),rev(dvals)), col="skyblue")

  • @EastWood19802
    @EastWood19802 5 หลายเดือนก่อน

    # プログラム更新しました # Retrieve Cohen's suggested effect sizes library("pwr") cohen.ES(test = "f2", size = "small") cohen.ES(test = "f2", size = "medium") cohen.ES(test = "f2", size = "large") f <- function(x){ a <- sqrt(x/(1+x)) return(a) } a1=f(0.02) ; a2=f(0.15) ; a3=f(0.35) a1<-paste0("小=", round(a1, 2)) a2<-paste0("中=", round(a2, 2)) a3<-paste0("大=", round(a3, 2)) c(a1, a2, a3) # Power=0.8 サンプルサイズ # install.packages("pwr") library (pwr) v= round(pwr.f2.test(u=1, f2=0.02, sig.level=0.05, power=0.8)$v, 1) paste0 ("v=" ,v) # Power=0.9 # サンプルサイズ library(pwr) a <- 0.05 po <- 0.9 f <- function(x) { a <- ceiling(pwr.f2.test(u = 1, f2 = x, sig.level = a, power = po)$v) + 2 return(a) } a1 <- f(0.02) a2 <- f(0.15) a3 <- f(0.35) a1 <- paste0("小(0.02)=", a1) a2 <- paste0("中(0.15)=", a2) a3 <- paste0("大(0.35)=", a3) c(a1, a2, a3)

  • @EastWood19802
    @EastWood19802 5 หลายเดือนก่อน

    ◎Rのプログラム # 1) 最尤推定法 data<-c(0,1,1) logLH<-function(x,q) { sum(x)*log(q)+(length(x)-sum(x))*log(1-q) } par(mar = c(6, 7, 5, 2)) plot(seq(0,1,0.01), logLH(data,seq(0,1,0.01)) , type="l", col="blue", main = "対数尤度関数の曲線" , xlab ="θ" , ylab = "対数尤度", lwd = 3, cex = 2, cex.main = 2, cex.lab = 2, cex.axis = 2 ) opt <- optimize(function(q) logLH(data,q),c(0,1),maximum = TRUE) print(str(opt)) abline(h=opt$objective, lty=2, col="blue") abline(v=opt$maximum,lty=2, col="blue") # 2) # Rによる最尤推定値の計算 data<-c(0,1,1) L_Be<-function(x,p) { p^sum(x)*(1-p)^(length(x)-sum(x)) } plot(seq(0,1,0.01),L_Be(data,seq(0,1,0.01)),type="l",col="blue") opt <- optimize(function(p) L_Be(data,p),c(0,1),maximum = TRUE) abline(h =opt$objective, lty=2, col="blue") abline(v =opt$maximum, lty=2, col="blue") print(opt) # ベータ分布< par(mar = c(5.5, 6.0, 4.1, 2)) par(mgp = c(4, 1.2, 0)) a <- 50 b <- 50 x <- seq(0.01, 1.0, len = 500)      y <- dbeta(x,a,b)      plot(x, y, type = "l",col=a+b,ylim=c(0,10), ylab ="PDF", cex.lab = 1.5, cex.axis = 1.5 , lwd = 4)   m = a/(a+b)             var = a*b/((a+b)^2*(a+b+1))   sdd = sqrt(var)*100        abline(v=m) legend("topright", legend = c(paste("Mean = ", round(mean(x), digits=2)) , paste("SD = ", round(sdd, digits=2) , "%")), cex = 2, bty = "n") # ベイズ更新の可視化のプログラム< data<-c(0,1,1) L_Be<-function(x,p) { p^sum(x)*(1-p)^(length(x)-sum(x)) } plot(seq(0,1,0.01),L_Be(data,seq(0,1,0.01)),type="l", xlab="", ylab="", ylim=c(0,8), xaxt="n", yaxt="n", col="blue") prior_beta<-function(p,a,b) dbeta(p,a,b)   a = 50 ; b = 50 beta<-function(x,p) prior_beta(p,a,b)   par(new=T) plot(seq(0,1,0.01),beta(data,seq(0,1,0.01)), type="l", xlab="", ylab="",ylim=c(0,8), xaxt="n", yaxt="n", col="red")   joint<-function(x,p) L_Be(x,p)*prior_beta(p,a,b)   par(new=T) plot(seq(0,1,0.01),joint(data,seq(0,1,0.01)),     type="l", ylim=c(0,8),xlab="", ylab="") optimize(function(p) L_Be(data,p),c(0,1),maximum = TRUE) optimize(function(p) L_Be(data,p)*prior_beta(p,a,b),c(0,1),maximum = TRUE) # 4 なぜα=β= 50 ? a <- 50                b <- 50 x <- seq(0.01, 1, len = 500) y <- dbeta(x,a,b)      # グラフの表示 plot(x, y, type = "l",col="red",ylim=c(0,10))   m = a/(a+b)*100       var = a*b/((a+b)^2*(a+b+1))  sdpt = sqrt(var)*100     paste("mean =", round(m, digits=2), "%") paste("sdv =", round(sdpt, digits=2) , "%") abline(v=m) install.packages("nleqslv") library(nleqslv) E=0.5  V=0.05^2  th<-function(x, E_th, V_th){ a=x[1] b=x[2] c(E_th-a/(a+b), V_th-(a*b)/(((a+b)^2)*(a+b+1))) } f<-function(x){ th(x, E, V) } an<-nleqslv(c(1,1), f) paste("α =" , round(an$x[1],digits=2), "β =", round(an$x[2], digits=2))

  • @zuchian
    @zuchian 5 หลายเดือนก่อน

    ハズレの扉を開けた後、選んだ扉を変えたら当たるかハズレるかの隔離では無いのですか•́ω•̀)? そこの所がイマイチ分かりません( ˘•ω•˘ ).。oஇ

    • @EastWood19802
      @EastWood19802 5 หลายเดือนก่อน

      ご視聴ありがとうございます。動画の中の、扉があいた時に黒く塗りつぶす、確率図を実際にかいてみてください。さらに、余談ですが、モンティホールの番組をみているTV視聴者が、ハズレの扉を開けた後に、TVをつけて見た人は、出演者が残るどちらの扉を選んでも、TVの視聴者のあてる確率は1/2になります。確率に絶対はない。みかたによってかわってしまう不思議な世界です。あと、モンティホール問題を補足した動画を出してあるので、参考にしてください。3枚ではなく100枚0扉で解説しています。URLはこちらです ⇒ th-cam.com/video/G8-XF1QkXSw/w-d-xo.htmlsi=s4Fv0ny3H0hfchdp

  • @EastWood19802
    @EastWood19802 6 หลายเดือนก่อน

    ◎Rのプログラム # 1. ライブラリの読み込み library(kernlab) # 2. 乱数のシードを設定 set.seed(123) # 3. ランダムデータを生成 x = rnorm(1000) y = rnorm(1000) data = data.frame(type = 1, x, y) # 4. One-Class SVMモデルを作成 one_class_SVM = ksvm(type ~ ., data = data, type = "one-svc", kernel = "rbfdot", kpar = list(sigma = 0.1), cross = 10, nu = 0.1) # 5. 正常値と外れ値を予測 pre = predict(one_class_SVM) # 6. 予測結果の変換 c.pre = ifelse(pre == TRUE, 1, 2) # 7. 予測結果の結合 data.result = cbind(data, c.pre) # 8. 結果のプロット:正常値は青、外れ値は赤、外れ値は×で表示 plot(data.result[, 2:3], pch = ifelse(data.result$c.pre == 1, 21, 4), bg = ifelse(data.result$c.pre == 1, "blue", "red"), col = ifelse(data.result$c.pre == 1, "blue", "red"), cex = ifelse(data.result$c.pre == 1, 1, 1.5), lwd = ifelse(data.result$c.pre == 1, 1, 2), xlab = "X 値", ylab = "Y 値", main = "One-Class SVMによる異常検知", col.main = "blue", col.lab = "blue", col.axis = "blue") legend("topright", legend = c("正常値", "外れ値"), col = c("blue", "red"), pch = c(21, 4), pt.bg = c("blue", "red"), pt.cex = c(1, 1.5), lwd = c(1, 2))

  • @EastWood19802
    @EastWood19802 6 หลายเดือนก่อน

    ◎Rのプログラム # その2 x<- c(30,36,47,48,50,52,55,55,55,60) y<- c(16,29,54,55,33,56,48,57,62,72) z<- c(48,69,108,114,67,124,91,106,116,132) d<-data.frame(x,y,z) View(d) d.lm<-lm(z~.,data=d) summary(d.lm) library(psych) pairs.panels(d) # その3 # AIC前の分析 y <- c(172, 156, 158, 168, 180, 170, 165, 175, 169, 155) # 身長 cm x1 <- c(75, 55, 60, 65, 80, 70, 60, 75, 70, 50) # 体重 kg x2 <- c(111, 83, 89, 98, 119, 104, 89, 113, 104, 74) # ウエスト cm # データフレームの作成 data <- data.frame("身長 cm" = y, "体重 kg" = x1, "ウエスト cm" = x2) # 1) 相関係数を求める coef <- round(cor(data), digits = 2) round(coef,digits = 2) # 変数間の相関をPlot pairs(data, pch=21, bg="red", cex=2) # 2) 回帰分析を実行 lm1 <- lm(y ~ x1 + x2, data=data) # 回帰分析結果を表示 round(coefficients(lm1), 2) # 回帰係数と切片の算出 summary(lm1) # 回帰分析の実行 # (参考)分析のもとになったデータと予測値、残差を一覧にする exp <- predict(lm1) # 元データに対する予測値 res <- residuals(lm1) # データと予測値の残差 view_lm1 <- data.frame(data[1], exp, res) # データフレームにまとめる print(round(view_lm1, digits =2 )) # 3)ステップワイズ(説明変数を減らしてAICを求める) step<-step(lm1)   # AIC後の分析 y <- c(172, 156, 158, 168, 180, 170, 165, 175, 169, 155) # 身長 cm x1 <- c(75, 55, 60, 65, 80, 70, 60, 75, 70, 50) # 体重 kg x2 <- c(111, 83, 89, 98, 119, 104, 89, 113, 104, 74) # ウエスト cm # AIC後の新たなモデルで回帰分析を実行 lm2 <- lm(y ~ x2, data=data) # 回帰分析結果を表示 round(coefficients(lm2), 2) # 回帰係数と切片の算出 summary(lm2) # 回帰分析の実行

  • @EastWood19802
    @EastWood19802 6 หลายเดือนก่อน

    ◎Rのプログラム # その1# 自己共分散を計算する (acf(Nile, type = "covariance", lag.max = 5, plot = FALSE)) # 自己相関係数を計算する (acf(Nile, lag.max = 5, plot = FALSE)) plot(Nile) acf(Nile) acf(Nile, lag.max = 10) # その2 # プロットの設定 par(cex.lab = 1.5, cex.axis = 2.0, lwd = 3, cex.main = 4, oma = c(0, 1, 0, 0)) # Nileデータのプロット plot(Nile, main = "Nile Data", xlab = "Year", ylab = "Flow", type = "l") # 新しい描画領域を作成 dev.new() # グラフ描画領域を1行に2つ並べる par(mfrow = c(1, 2)) # プロットの設定 par(cex.lab = 1.5, cex.axis = 2.0, lwd = 4, cex.main = 3) # Nileデータの自己相関係数のコレログラムを描く acf(Nile, main = "ACF of Nile Data", xlab = "Lag", ylab = "ACF") # Nileデータの偏自己相関係数のコレログラムを描く acf(Nile,type="p", main = "PACF of Nile Data", xlab = "Lag", ylab = "PACF")

  • @EastWood19802
    @EastWood19802 6 หลายเดือนก่อน

    ◎Rのプログラム # 5 サンプルサイズの設計 # install.packages("pwr") # はじめて使用する場合、先頭の # を消してください。 weight <-c(41, 36, 52, 38, 45, 42) score <-c(72, 81, 90, 72, 85, 77) r0=cor(weight, score) ; r0 # 相関係数 # 散布図 par(mar = c(5.5, 6.0, 4.1, 2)) par(mgp = c(4, 1.2, 0)) plot(weight, score, xlab = "体重(kg)", ylab = "点数(点)", cex.lab = 2, cex.axis = 1.5, lwd = 4) library("pwr") a=0.05 # 有意水準 # 検出力 pwr.r.test(n= 6, r=r0, sig.level=a, alternative=c("two.sided")) # サンプルサイズの設計 pwr.r.test(power =0.8, r=r0, sig.level=a, alternative=c("two.sided"))

  • @EastWood19802
    @EastWood19802 6 หลายเดือนก่อน

    ◎Rのプログラム # 4 相関係数の検定 # -----簡単な方法 weight <-c(41, 36, 52, 38, 45, 42) score <-c(72, 81, 90, 72, 85, 77) # 散布図  par(mar = c(5.5, 6.0, 4.1, 2)) par(mgp = c(4, 1.2, 0))  plot(weight, score, xlab = "体重(kg)", ylab = "点数(点)", cex.lab = 2, cex.axis = 1.5, lwd = 4) cor(weight, score) # 相関係数 r cor.test(weight, score)   # 相関係数の検定 # -----詳細な方法 weight <-c(41, 36, 52, 38, 45, 42) score <-c(72, 81, 90, 72, 85, 77) # 検定統計量をもとめる n=length(weight) r=cor(weight,score,method="pearson") r # 相関係数 t=r*sqrt(n-2)/(sqrt(1-r^2)) # 相関係数 t 検定統計量 t # 相関係数 t 検定統計量 # 散布図とt分布を描画 par(mar = c(5.5, 6.0, 4.1, 2)) par(mgp = c(4, 1.2, 0)) # 自由度をもとめる(n-2) df=n-2 curve(dt(x,df),-5,5, cex.lab = 2, cex.axis = 1.5, lwd = 4) # t 分布曲線を書く # 図上に表記 qt(0.025,df) # 下方2.5%点の導出 qt(0.975,df) # 上方2.5%点の導出 abline(v=qt(0.025,df)) # 下方2.5%点の線 abline(v=qt(0.975,df)) # 上方2.5%点の線 abline(v=t,col=2, lwd = 4) # t 検定統計量の線 2*(1-pt(t, df)) # p値をもとめる 2*pt(t,df,lower.tail =FALSE) でもよい

  • @EastWood19802
    @EastWood19802 6 หลายเดือนก่อน

    ◎Rのプログラム #2 相関係数 library("corrr") # ------変数x (身長) cm xvar <- c(161.6, 153.9, 161.2, 172.0, 158.7, 163.3, 155.1, 159.8, 163.5, 147.9) # ------変数y (体重) kg yvar <- c(52.5, 46.7, 49.0, 58.5, 55.2, 48.3, 53.2, 47.0, 60.2, 41.7) # 散布図の描画 par(mar = c(5.5, 6.0, 4.1, 2)) par(mgp = c(4, 1.2, 0))  plot(xvar, yvar, xlab = "身長 cm", ylab = "体重 kg", cex.lab = 2, cex.axis = 1.5, lwd = 4) # ------関数を定義(2変数の標本共分散) # 2変数の標本共分散 (分母がn) sample_covariance <- function(x, y) { var(x, y) * (length(x)-1)/length(x) } sample_covariance(xvar, yvar) # 2変数の不偏共分散(分母がn-1) cov(xvar, yvar) # 2変数の相関係数 cor (xvar, yvar) # 参考   # (不偏)分散共分散行列で求める   sample_data <-data.frame(xvar, yvar) cov(sample_data) var(sample_data) # 相関行列を求める   cor(sample_data)