• 日本語
    • English (英語)
Avintonジャパン株式会社Avintonジャパン株式会社Avintonジャパン株式会社Avintonジャパン株式会社
  • サービス
    • Avinton Data Platform
    • エッジAIカメラ
    • プライベートクラウド
    • AIサービス開発
    • AI画像解析 – 無償PoC
  • 最新情報
    • ニュースリリース&イベント情報
    • 技術ブログ&インタビュー
  • アカデミー
    • Avintonアカデミー
    • Academy on Campus
  • 採用情報
    • Avintonで働く魅力
    • 新卒採用
    • プロジェクトコーディネーター職紹介
    • 求人
    • よくある質問
  • 企業情報
    • 会社概要
    • 代表からご挨拶
    • SDGsへの貢献
  • お問い合わせ

機械学習入門者向け 分類と回帰の違いをプログラムを書いて学ぼう

  • Python3.8 と OpenCV のインストール (Ubuntu20.04LTS)
  • ルーティング
  • postgreSQLへのshp fileのimport
  • NAT
  • PostGIS exercise
  • 三目並べ – 2.〇×を交互にゲーム盤に入るようにしよう
  • Docker 概要とセットアップ
  • 三目並べ – 3.勝敗がつくようにしよう
  • Docker Engineのubuntu上へのinstall
  • EC2からS3へ自動でぽいぽいアップロードするスクリプトの作成
  • 三目並べ – 4.「スタート」「リセット」ボタンをつけよう
  • 三目並べ – 5.先攻後攻を決めて、コンピュータ対戦にしよう(前編)
  • Apache Zeppelin 基本機能
  • Ruby on Rails を MySQLでセットアップ
  • 機械学習入門者向け Support Vector Machine (SVM) に触れてみる
  • AWSアカウントの作成と必ずやるべきセキュリティ対策
  • Scala 基礎
  • VLAN
  • Apache Spark 基礎
  • 機械学習を用いた画像分類
  • Ruby on Railsによる簡単なウェブアプリケーション
  • 正規表現とパイプ
  • 機械学習エンジニアに必要なスキル
  • Docker, Kubernetesの学び方について
  • Ubuntuの基本設定
  • PostgreSQL Setup
  • REDIS
  • Amazon EC2 インスタンスの初期設定をしよう
  • 軽量版Kubernetesディストリビューション – k0s クラスターの構築
  • Pythonの設定
  • GNS3のセットアップ
  • viエディタ
  • AWSのEC2インスタンスでWordPressブログを公開してみよう
  • Pythonでデータベースを操作する
  • Python2.7とOpenCVのインストール
  • ファイル操作コマンド
  • OpenCVのテストプログラム
  • グループとユーザー
  • Pythonで画像を分類するプログラムを作成する
  • AWS CLIをインストールしてコマンド操作しよう
  • Virtualisation and Container (仮想化とコンテナ) – Ansible, Docker and Kubernetes
  • Windows Server 2012 R2 Hyper-V
  • 困った時に使うコマンド
  • SparkMLによるKaggle Titanic生存者予測
  • PacketTracerのセットアップ
  • 一般グループのユーザーとグループ
  • AWS Route 53を使って独自ドメインのWebページを表示させてみよう
  • Kubernetesクラスター上へのOpenVINOモデルサーバーを使用したサンプルアプリケーションのデプロイ
  • プライバシーポリシー
  • VMware ESXi サーバー構築
  • 三目並べ – 6.先攻後攻を決めて、コンピュータ対戦にしよう(後編)
  • フロントエンド開発のための環境構築
  • フロントエンドのデモンストレーション
  • APIのデモンストレーション
  • CISCO 1800ルータセットアップ
  • ファイル検索コマンド
  • ESXi – Switchの追加とVLAN
  • 質問
  • 仮想化環境のディスク容量を拡張する
  • ユーザー権限とアクセス権
  • 三目並べ – 0.導入
  • テキスト処理
  • ESXi – VyOS
  • データベースへのデータロード
  • 機械学習入門者向け Naive Bayes(単純ベイズ)アルゴリズムに触れてみる
  • CCNA
  • ESXi – 小規模ネットワーク 構築
  • ファイル管理
  • 機械学習入門者向け ChainerRLでブロック崩しの学習
  • AWS CLIを使ってEC2のファイルをS3へアップロードしよう
  • Apache NiFiの環境設定
  • CSV import & export – Node.js, mySQL – 1
  • 機械学習入門者向け ランダムフォレストによる Kaggle Titanic生存者予測
  • NodeJSでWebアプリケーション開発 – Socket.IO編
  • CSV import & export – Node.js, mySQL – 2
  • Apache NiFi データパイプライン基礎
  • PCからルータ、スイッチへのSSH接続設定
  • 【Python入門】Python Numpy チュートリアル
  • SQL 便利な関数
  • PostgreSQLによるデータ分析
  • Apache NiFi Exercise
  • 機械学習入門者向け 分類と回帰の違いをプログラムを書いて学ぼう
  • NodeJSでWebアプリケーション開発 – React編
  • Pythonによるマルチスレッドプログラミング実践
  • Apache SparkとApache Zeppelinの概要と環境構築
  • Certbotを使ってSSL証明書を発行し、HTTP通信を暗号化しよう
  • DockerとApacheを使ってWebサーバーを構築しよう
  • NodeJSでWebアプリケーション開発 – React編
  • Redux基礎 – 主要な概念と用語
  • AmazonEC2とVPCでネットワークとサーバーを構築しよう
  • AWS入門者向け 初心者が最初に理解すべきEC2とVPCの基本的な用語解説
  • Linuxとは
  • Pandasによる構造化データ分析
  • ダイナミックルーティング
  • PostgreSQL – Python – Apache – Bootstrap
  • 三目並べ – 1.ゲーム盤を作ろう
Home Avintonアカデミー 機械学習入門者向け 分類と回帰の違いをプログラムを書いて学ぼう

機械学習 分類 回帰
このアカデミーでは、機械学習における分類と回帰の違いについて整理します。
この2つの違いを整理することによって、分類のアルゴリズムや回帰のアルゴリズムを学ぶための助けになればと思います。
分類と回帰の位置づけとしては、両方とも教師あり学習にあたります。

機械学習

教師あり学習
・クラス分類
・ニューラルネットワーク(deep Learning)
・回帰分類

教師なし学習
・クラスタリング
・k-means

強化学習
・Q学習

教師あり学習と教師なし学習について解説した記事はこちら
【機械学習入門】教師あり学習と教師なし学習

 

二ューラルネットワークやQ学習について解説した記事はこちら
【機械学習入門】 深層強化学習の基礎

分類

機械学習入門 分離

分類のイメージ

分類の主な目的は、データが属するクラス(Yes,Noのような)を予測することです。
特に、予測するクラス数が2クラスの場合、2値分類と呼ばれます。

具体例としては、ある学生のプロフィールを入力として、その学生が合格か不合格かを予測します。
他の例としては、顧客の購買情報からその顧客が新商品を買うか買わないかを予測します。

これらの予測問題は2値分類に属します。
2クラスより多い分類予測については、多クラス分類として知られています。
具体例としては、学生の課題の詳細な情報から、その学生の評価(S,A,B,etc…)を予測します。
画像に写っている物の判断も多クラス分類問題として知られています。

回帰

回帰の主な目的は、連続値などの値の予測です。
具体例としては、広告予算の増加による商品の売り上げの増加を予測します。
回帰分析には、線形回帰、多項式回帰などが存在します。
図は線形回帰のイメージです。過去の広告予算ごとの売上データをもとに回帰直線を作成します。この回帰直線を利用して、予算から売上を予測します。

機械学習入門 回帰 分類

線形回帰のイメージ

分類と回帰の違い

機械学習入門 分類 回帰

分類と回帰の違いのイメージ

分類の例

過去に訪れた飲食店の情報をもとに、新しい飲食店が気に入るかどうかを予測します。
この予測の目的は、飲食店を気に入る(Yes)か気に入らない(No)かを予測することです。
この問題はクラス分類問題(2値分類)であるといえます。

回帰の例

過去に訪れた飲食店の情報をもとに、新しい飲食店に訪れる回数を予測します。
この予測の目的は飲食店を訪れる回数で、具体的な値を予測します。
回帰分析は過去のデータから何かの値を予測する、教師あり学習に含まれます。

分類と回帰の違いをプログラムを書いて学ぶ

分類と回帰の違いを実際にJupyter Notebook上でプログラムを書きながら学んでみましょう。

こちらからJupyter Notebookをダウンロードしてください。

Jupyter Notebookを使用するにはAnacondaがインストールされている必要があります。
Anacondaのインストール方法は、機械学習を用いた画像分類をご覧ください。

機械学習入門 分類 回帰

Jupyter Noterbook上でプログラムが実行できます。

以下にJupyter Notebook上にある、コード例を紹介します。
Jupyter Notebookでは、コードを書くと結果がすぐに表示され、プログラミングを書きながら学ぶことができます。

必要なライブラリのインポート

1
2
3
4
5
6
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
 
from sklearn.linear_model import LinearRegression
from sklearn.neighbors import KNeighborsClassifier

 

今回扱う点データの作成

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# データ生成の中心点
center = [ [1.5, 0.5], [-2.0, -1.0], [0,0]]
# 各中心点から生成する点の数
DSIZE = 20
# データの生成
data = [ c + (np.random.randn(DSIZE,2) / 2) for c in center]
data = np.concatenate(data)
 
# 生成されたもとの点ごとのラベル
label = np.arange(3*DSIZE)//DSIZE
 
# 表示
for i in range(3):
plt.scatter(data[:,0][label==i],data[:,1][label==i])

線形回帰の例

今回の線形回帰では、先ほど生成した点のx座標を入力として、y座標を予測するモデルを作成する

データの分離

点データをx座標(予測モデルに入力する値)と、y座標(予測したい値)に分ける

1
X, y = np.split(data, 2, axis=1)

 

適当なx座標を入力して、y座標の値を予測する

1
2
3
test_X = np.arange(-4, 5)
test_X = test_X.reshape(len(test_X), 1)
y_predict = lr.predict(test_X)

 

予測結果の確認

1
print(y_predict)

[[-1.25995015]
[-0.95403541]
[-0.64812067]
[-0.34220593]
[-0.03629118]
[ 0.26962356]
[ 0.5755383 ]
[ 0.88145304]
[ 1.18736778]]

1
2
3
4
5
6
7
plt.scatter(X, y, label="data")
plt.plot(test_X, y_predict, label='linear model')
plt.xlim(-4,4)
plt.ylim(-4,4)
plt.title("Predict result")
plt.grid()
plt.legend()

 

今回の予測モデルの式

y=x∗a+b

1
2
y_predict_function = lambda x: x * lr.coef_ + lr.intercept_
print(y_predict_function(3))

分類の例

今回の分類では、点のx,y座標を入力として、その点が属するクラス(label)を予測するモデルを作成する。

K-Nearest Neighbor(KNN)の予測モデルを作成

data(x, y座標)とそれに対応するlabel(点が属するクラスを表す)のペアを入力として、
KNNの予測モデルを生成する。

1
neigh = KNeighborsClassifier().fit(data, label)

 

適当な点のx, y座標を入力して、その点が属するクラスを予測する

1
2
test_Xy = np.array([np.random.rand(10) * 6 - 3, np.random.rand(10) * 4 - 2]).T
predict_label = neigh.predict(test_Xy)

 

予測結果の確認

1
print(predict_label)

[0 0 2 1 2 2 0 1 2 0]

分類結果の描画

★がtest_Xyの点で、それぞれの色がクラスに対応している
(test_Xyの座標によって、★の色が黄色とか紫に変わることがある…)

1
2
3
4
5
for i in range(3):
rgb = [False for i in range(3)]
rgb[i] = True
plt.scatter(data[:,0][label==i],data[:,1][label==i], c=rgb)
plt.scatter(test_Xy[:,0][predict_label==i], test_Xy[:,1][predict_label==i],c=rgb, marker="*", s=200)

まとめ

クラス分類と回帰は、データと対応する正解をもとに予測をする教師あり学習となります。
対象のデータが属するクラスを予測するときは分類、値を予測するときは回帰となります。

あなたも、Avintonでこのような最先端技術を習得し活用してみませんか?

社員の成長を導きながら、AIやビッグデータなどの最先端技術をプロジェクトに活用していくことが私たちのビジョンです。Avintonの充実した技術研修でスキルアップを図り、あなたのキャリア目標を一緒に達成しませんか?

採用情報

採用情報

採用情報

Avinton SDGs

SDGsへの貢献

Search

タグ

AI AI Big Data Big Data ccna Digital Transformation DX IoT IoT LPIC Python Ruby SDGs Webエンジニア イベント インタビュー インフラエンジニア エンジニア オンラインセミナー キャリアチェンジ コンテナ技術 サーバーエンジニア システム開発 データサイエンス データベース データ分析 データ解析 ネットワークエンジニア ビックデータ 人工知能 仮想化 勉強会 営業 就職活動 技術インターン 採用 新卒 新卒採用 新規事業 機械学習 派遣 深層学習 社員インタビュー 経営者交流会 転職
© 2022 Avinton | All Rights Reserved | プライバシーポリシー
  • サービス
    • Avinton Data Platform
    • エッジAIカメラ
    • プライベートクラウド
    • AIサービス開発
    • AI画像解析 – 無償PoC
  • 最新情報
    • ニュースリリース&イベント情報
    • 技術ブログ&インタビュー
  • アカデミー
    • Avintonアカデミー
    • Academy on Campus
  • 採用情報
    • Avintonで働く魅力
    • 新卒採用
    • プロジェクトコーディネーター職紹介
    • 求人
    • よくある質問
  • 企業情報
    • 会社概要
    • 代表からご挨拶
    • SDGsへの貢献
  • お問い合わせ
  • 日本語
    • English (英語)
Avintonジャパン株式会社