【8分でわかる】特徴量エンジニアリングの重要性とテクニック
ฝัง
- เผยแพร่เมื่อ 27 ส.ค. 2024
- 機械学習入門に必要な知識と勉強方法はこちら
toukei-lab.com...
この動画では、精度の高いモデルを構築する上で非常に重要な特徴量エンジニアリングについて簡単に解説していきます。
特徴量エンジニアリングの流れやテクニックを知っているのと知っていないのとではたたき出すアウトプットの質が全く違うので必ず理解しておきましょう!
この動画では、そんな特徴量エンジニアリングについて2つのパートに分けて解説していきます!
1.特徴量エンジニアリングとは
2.特徴量エンジニアリングのテクニック
■スタビジ
スタビジは「データサイエンスをもっと身近なものに!」をモットーにデータサイエンスの面白さをビジネスを絡ませながら発信しているチャンネルです。
チャンネル登録はこちら↓
/ @aiby8596
■サイト(データサイエンスを発信するメディア)※旧:統計ラボ
toukei-lab.com/
・特徴量エンジニアリング
toukei-lab.com...
■関連動画
・機械学習入門
• 【超入門】機械学習をビジネスの例も出しながら...
・欠損値処理
• 【7分で分かる】欠損値が発生するメカニズムと...
■「コスパよくデータサイエンスを学べるスクール」スタビジアカデミー
toukei-lab.com...
■Twitterアカウント
ウマたん@スタビジ: / statistics1012
■私が講師のUdemy講座
以下の記事に私が講師を務めるAIやデータサイエンス関連の講座一覧をまとめています!
toukei-lab.com...
この記事内限定で全ての講座が安くなる講師クーポン(最大94%OFF!)を公開していますのでご受講の際はぜひお使いください!
■出版書籍
・俺たちひよっこデータサイエンティストが世界を変える
amzn.to/36XbMFJ
・【入門】Pythonを覚えてエリートリーマンへ!落ちこぼれリーマンの逆転劇:amzn.to/31drMyU
・おばあちゃんがWebマーケティングを勉強して雑貨屋をV字回復!
amzn.to/3vG3tqC
・漫画で分かるデジタルマーケティング ✕ データ分析
amzn.to/44iT84Q
・データサイエンス大全 -シンプルにわかる49の用語と13の実践
amzn.to/3mFzhwG
【視聴ガイド】
00:48 特徴量エンジニアリングとは
02:23 特徴量エンジニアリングのテクニック
03:20 One hot encoding
04:29 Frequency encoding
04:45 Target encoding
05:20 クラスタリングで特徴量作成
05:43 欠損値の処理
コンセプトも声も内容も全部聞きやすくて、勉強になってます。助かります☺️🌸
ありがとうございます!!
自分用メモ
説明変数→原因となってる変数
目的変数→結果となってる変数
決定木モデルではone-hot-encodingが必要ない
one-hot-encodingには変数同士の重複による多重共線性の危険がある
target encodingでは目的変数の情報を特徴量に用いることになるからリークに気をつける必要がある
説明変数が特徴量なんですね!
そうなんです!
ありがとうございました!
テクニックも大事だとは思いますが、試す▷NG▷やり直すと言った不屈の精神も大事なのかなと感じていたりしてます。
スムーズにキレイに真っ直ぐに走れることもあるのでしょうか?
松本達也 どこまで精度を求めるかによりますので一概には言えませんが、やはりある程度の不屈の精神は必要ですね。
ただ、意外と精度を高める部分よりもそのアウトプットをどのようにビジネスに落とし込むかの部分の方が大変だったりします。。。
@@aiby8596 ありがとうございました!
ビジネスへの落とし込み方ですか、勉強になりました。
特徴量エンジニアリングにおすすめの本とかないですかね?😭
機械学習の知識は、はじめてのパターン認識(平井著)を数式含めて理解しているくらいなので、最新の手法とかは分からないレベルです。。
「kaggleで勝つデータ分析の技術」がオススメです!
@@aiby8596 ありがとうございます!これは有名な書籍ですね。週末、紀国書店行って見てきます!
05:00 のところBが2つあるのはミスでいいんだよね