AI

新卒のAI開発担当者が仕事に役立ったと思う、無料で学べるデータサイエンス教材(Webサイト編)

データ分析、AI構築支援、AI教育事業を手がけるAMBL株式会社のAIfileld Company2年目の傍示健太です。好きな色は黄色です。現在は会社の自社プロダクトの登録を一括で管理するシステムの開発と、SQLを用いたデータ抽出の受託案件の仕事を行っています。

この記事を書こうと思ったきっかけは、私自身がデータサイエンスを学ぶために教材探しをしていた際に無料でも良質な教材が多いことに気付き、実際に今回紹介した教材が仕事の役に立っているからです。データサイエンスに関連する書籍や研修は高額なものが多いとお困りの方もいると思うので、データサイエンスの自主学習のハードルを下げるために、自分が有益だと思った教材をシェアします。

本記事では無料で学べるデータサイエンス教材(Webサイト編)として、ネットの優良な教材を紹介していきます。
中々量も多いので自分の興味関心のある分野から挑戦していってみてください。


■データサイエンス基礎・統計学

数理・データサイエンス教育強化拠点コンソーシアム

東京大学数理数理・情報教育研究センターが公開している、「数理・データサイエンス・AIモデルカリキュラム」に準拠した教材です。
数理・データサイエンス・AIモデルカリキュラムとは、国内すべての大学・高等専門学校が参照可能なモデルカリキュラムとして策定されたもので、学生がデータサイエンスを学ぶ上で必要な情報を網羅的にまとめているものです。

この教材は政府の「AI戦略2019」に準拠した内容となっており、モデルカリキュラムのすべてに対応した初めての教材となっています。
教材のレベルとしては「リテラシーレベル教材」と「応用基礎レベル」に分かれています。初級のリテラシーレベルでは、社会におけるデータ・AI利活用や、数学の基礎、データの読み方や表現、AIの構築・運用の基礎知識などが網羅されています。
応用基礎レベルでは、分析設計、ビッグデータとエンジニアリング、AIの歴史と応用分野、深層学習の基礎と今後の展望などが網羅されています。
データサイエンスの初学者は勿論、現在業務で利用している方も一回目を通すことをオススメしたい教材です。

巣ごもりDXステップ講座情報ナビ

近年のデジタルスキルの必要性や、コロナ禍での社会人の学びなおし・リカレント教育の意欲の高まりを背景として、経済産業省が開設した「DXを無料で学べる講座紹介」のサイトです。現在の掲載コンテンツは合計40事業者100講座(2022年4月8日時点)もあり、内容もPythonの講座、データサイエンスの講座、Azureなどのクラウドに関する講座やソフトウェアの講座、Androidアプリの講座など幅広い内容を学ぶことができます。
また講座のレベルに関しても入門、基礎、上級が用意されており、ゼロから学び始めたい人からすでに基礎的な知識を習得していて、更に上を目指したい人まで網羅的にカバーしてくれています。

このサイトは、令和4年中に、令和4年3月29日に開設したポータルサイト「マナビDX(デラックス)」へ移行いたします。

▼JMOOC

一般社団法人日本オープンオンライン教育推進協議会(JMOOC)が運営しているサイトです。JMOOCは、世界で注目されている大学教授などの本格的な無料のオンライン講義、いわゆる「MOOC(Massive Open Online Courses)」を産学一体で推進する団体です。

データサイエンスに必要となる「線形代数」、「微積分」などの数学や、データサイエンスのビジネス活用など幅広い講義を無料で受講することができます。
大学のオンライン講義のような形式になっており、各講座の理解度を確認するための小テストや課題の提出、講座終了後の最終課題の提出が必要です。
これらの課題の全体評価が修了条件を満たしていると修了証が貰えるので、とてもやりがいを感じるサイトです。

▼統計WEB

統計学の基礎から統計検定2級までの範囲を網羅的に学ぶことができるサイトです。数式だけでなく具体例が多数掲載されているので、統計学の初心者にもイメージしやすい内容になっています。サイト内で過去の統計検定2級の問題の解説や、その問題を解く際に使う公式の説明をサイト内のリンクで飛んですぐに確認できる仕様になっています。

統計検定2級を受験する予定のある方には絶対活用して頂きたいサイトです。

■機械学習

松尾研究室 演習コンテンツ公開ページ

東京大学の松尾研究室が監修等を担当した、東京大学で開催中の講座の演習コンテンツを、個人向けに無償公開しているページです。
現在では「東京大学グローバル消費インテリジェンス寄附講座」とDeep Learningエンジニア育成講座「DL4US」の2つの講座が公開されています。
どちらの講座もJupyter Notebook形式で作成されており、自由に教材を編集して試行錯誤しながら学習を進めることができます。

「東京大学グローバル消費インテリジェンス寄附講座」ではPythonの基本文法からnumpy、pandasなどのライブラリ、機械学習のモデルの構築まで一気通貫に学ぶことができるようになっており、初心者の方でも気軽に始められると思います。
「DL4US」は深層学習の基礎から、画像分野、自然言語分野、強化学習分野などE資格で出題される内容を自分で演習を解きながら学習を進めていく内容になっています。
しかしこちらは中々難易度も高いので、まずは「東京大学グローバル消費インテリジェンス寄附講座」や、「数理・データサイエンス教育強化拠点コンソーシアム」辺りの教材でデータサイエンスの基礎を学んだうえで取り組むことをオススメします。

筑波大学オープンコースウェア 機械学習概論と単回帰 (1)

筑波大学がオープンコースウェア(TSUKUBA OCW)で無償公開している機械学習を本格的に学べる全20回の講義動画です。今回紹介する講座以外にも様座な分野の講義動画が既に公開されています。

この講座では、「機械学習の講義で単回帰・重回帰分析」や「k-meansからニューラルネットまで機械学習の理論」を多数のスライドや実際の黒板で説明されるので、数式の理解を深めながら学習を進めることができます。
講義ノートや演習問題をダウンロードする事も可能なので、動画を視聴後に演習問題を解くサイクルで学習を進めていけば、より機械学習の理論について理解が深まると思います。


■ディープラーニングフレームワーク

■Tensorflow公式チュートリアル

Googleが開発した世界で最も有名なディープラーニングライブラリのTensorflowの使い方についてGoogle Colabを実行しながら学習することができる公式チュートリアルです。
チュートリアルの内容として画像、音声、自然言語処理、強化学習など幅広い分野の実装例や、ディープラーニングの学習結果を可視化できる「Tensor Board」などの拡張機能について紹介されています。

習熟度に応じて「初心者のための TensorFlow 2.0 入門」、「エキスパートのための TensorFlow 2.0 入門」と選択できるので自分のレベルに合わせて取り組んでみてください。

▼PyTorchチュートリアル(日本語翻訳版)

Tensorflowと並んで著名なディープラーニングライブラリの「Pytorch」英語版の公式チュートリアルを翻訳したサイトです。こちらも解説ページと合わせてGoogle Colabのファイルが用意されているので、Google Colabを使って実際に手を動かして学習することができます。
チュートリアルの内容としては、pytorchの基本的な文法から画像処理、自然言語処理、深層強化学習、音声データなどこちらもディープラーニングの幅広い分野の実装について紹介されています。

■おわりに


いかがでしたでしょうか?今回はデータサイエンスについて無料で学べるWebサイトについて紹介しました。

内容も豊富でどれから始めたら良いか迷うかもしれませんが、初学者の方はひとまず、数理・データサイエンス教育強化拠点コンソーシアム巣ごもりDXステップ講座情報ナビJMOOCから入ってみるのがオススメだと思います。

その上で統計を特に学びたい人は統計Web、機械学習やディープラーニングを学びたい人は松尾研究室 演習コンテンツ公開ページ筑波大学オープンコースウェア 機械学習概論と単回帰 (1)、ディープラーニングのフレームワークについて学びたい人はTensorflow公式チュートリアルPyTorchチュートリアル(日本語翻訳版)と自分の興味のある分野から学習を進めてみてください。

本記事がデータサイエンスを学習したい方の参考になれば幸いです。

新卒のAI開発担当者が仕事に役立ったと思う、無料で学べるデータサイエンス教材(テキスト編)


あなたもAMBLで働いてみませんか?


AMBLは事業拡大に伴い、一緒に働く仲間を通年で募集しています。
データサイエンティスト、Webアプリケーションエンジニア、AWSエンジニア、ITコンサルタント、サービス運用エンジニアなどさまざまな職種とポジションで、自分の色を出してくださる方をお待ちしています。ご興味のある方は、採用サイトもご覧ください。

●AMBL採用ページ

-メンバーインタビュー (1日の仕事の流れ/やりがい/仕事内容)
-プロジェクトストーリー (プロジェクトでの実績/苦労エピソード)

●募集ページ
プリセールス/ エンジニア/ クリエイター/ データサイエンティスト /営業・コンサルタント /コーポレート /サービス企画 /教育担当

ABOUT ME
傍示健太
株式会社エイアイフィールドの2021年度の新卒でデータサイエンティストとして働いています。 資格:G検定、E資格、統計検定2級 趣味は温泉巡りと食べ歩きです。 最近はモルカーのアニメにハマっています! モルカーの愛くるしい仕草と1話2分とお手軽に見えるところが最高です!