スキル内容
Pythonを使った機械学習の学習において、教本やウェブサイトでは「アヤメの分類をしてみよう!」といった例題がよく目にされるかと思います。しかし、実際のビジネス現場では、「アヤメの花の分類」といった課題を抱える人はほとんどいません。私も最初は機械学習の学習を始めたとき、教本と現場のギャップに悩まされました…
実際の現場では、よく「必要なデータが別の部署で管理され、フォーマットがバラバラ」といった状況や「データが汚くてすぐに分析できない」といった問題に直面します。
そこで、このレッスンでは実際の現場で扱われるような「リアルなデータ」を教材にし、単なる知識だけでなく、実際の現場で役立つPythonデータ分析のスキルを身につけることを目指します!
このレッスンを受講することで、以下の内容を実践形式で学ぶことができます:
✅ 実際の現場で扱われるデータの種類
✅ そうしたデータを扱う際に生じる問題
✅ それらの問題にどのように対処すれば良いか
また、レッスンで使用するGoogle Colaboratoryのコードも提供しますので、復習も自分で行うことができます。
このレッスンは以下のような方々に向けています:
✅ 実際の現場で役立つPythonデータ分析のスキルを身につけたい方
✅ 独学で勉強しているが、教材が仕事内容と一致せずモチベーションが上がらない方
✅ 完全な初心者から、ある程度Pythonプログラミングの知識がある方まで
データ分析では「前処理8割」を言われているほど分析は準備が重要です。
このレッスンでは基礎編として、小売店のリアルな購買データを使用した以下の内容をカバーします:
・分析環境の用意(Google Colaboratory)
・データの読み込みと書き出し
・データの結合(ユニオン、ジョイン)
・データのグループ化と集約
・月別の統計的な購買集計(平均、中央値、最大値、最小値など)
・商品別売上推移の可視化(ヒストグラム、折れ線グラフなど)
このレッスンでは、実際の現場で遭遇するであろうデータの課題と、それらに対処するための手法を実際のデータを用いて学ぶことができます。Google Colaboratoryを使用することで、実際のコードを実行しながら学ぶことができます。
必須質問項目
※本レッスンはPythonの入門講座ではありません。レッスンを受けられる方がデータサイエンティストとして、現場で即戦力として活躍することを目指した現場のデータ分析の実践レッスンです。Python入門講座は別途出品しておりますレッスンご用意しておりますのでご参照ください。
※動作環境
本レッスンではGoogle Colaboratoryを利用します。ブラウザとしてGoogle Chromeがご使用できる環境であることをレッスン前にご用意ください。またGoogle Colaboratoryについての解説は別レッスン「GoogleColaboratoryを解説します」をご用意しておりますのでご参照ください。
今後も応用編として、現場レベルにリアルなデータを使ったどんどんレッスンを増やしてまいります。
- 現場のリアルなデータを事前加工(データクレンジング)
- 顧客構造分析
- 回帰分析
- 決定木分類分析