• 日本語
    • English (英語)
Avinton JapanAvinton JapanAvinton JapanAvinton Japan
  • サービス
    • Avinton Data Platform
    • エッジAIカメラ
      • 自動車ナンバープレート自動認識システム
    • プライベートクラウド
    • AIサービス開発
    • AIカメラ/画像解析無料体験版
  • 最新情報
    • ニュースリリース&イベント情報
    • 技術ブログ&インタビュー
  • アカデミー
    • Avintonアカデミー
    • Academy on Campus
    • Academy with Platform
  • 採用情報
    • Avintonジャパン 採用ページ
    • 求人一覧
    • よくある質問
    • 新卒採用
  • 企業情報
    • 会社概要
    • 代表からご挨拶
    • SDGsへの貢献
  • お問い合わせ

YOLOv8を用いた物体検出

  • ルーティング
  • データベースの命名規則
  • 三目並べ – 2.〇×を交互にゲーム盤に入るようにしよう
  • 三目並べ – 3.勝敗がつくようにしよう
  • クリーンコード(Clean Code)
  • 三目並べ – 4.「スタート」「リセット」ボタンをつけよう
  • 三目並べ – 5.先攻後攻を決めて、コンピュータ対戦にしよう(前編)
  • インフラストラクチャー(サーバー、コンポーネント、RAID)
  • 機械学習入門者向け Support Vector Machine (SVM) に触れてみる
  • YOLOv8を用いた物体検出
  • 正規表現とパイプ
  • 機械学習エンジニアに必要なスキル
  • 軽量版Kubernetesディストリビューション – k0s クラスターの構築
  • ファイル操作コマンド
  • グループとユーザー
  • 困った時に使うコマンド
  • 一般グループのユーザーとグループ
  • プライバシーポリシー
  • 三目並べ – 6.先攻後攻を決めて、コンピュータ対戦にしよう(後編)
  • フロントエンド開発のための環境構築
  • ファイル検索コマンド
  • 質問
  • 仮想化環境のディスク容量を拡張する
  • ユーザー権限とアクセス権
  • データ分析基礎 – Part1
  • 三目並べ – 0.導入
  • テキスト処理
  • データベースへのデータロード
  • 機械学習概要1
  • 機械学習入門者向け Naive Bayes(単純ベイズ)アルゴリズムに触れてみる
  • ファイル管理
  • SSHを使用してホストOSからゲストOSに接続する
  • 機械学習入門者向け ChainerRLでブロック崩しの学習
  • 機械学習入門者向け ランダムフォレストによる Kaggle Titanic生存者予測
  • 機械学習概要2
  • データ分析基礎 – Part 2
  • 機械学習入門者向け 分類と回帰の違いをプログラムを書いて学ぼう
  • フロントエンドのWeb開発について
  • ダイナミックルーティング
  • 三目並べ – 1.ゲーム盤を作ろう
  • 【Python入門】Python Numpy チュートリアル
  • Amazon EC2 インスタンスの初期設定をしよう
  • AmazonEC2とVPCでネットワークとサーバーを構築しよう
  • Apache NiFi Exercise
  • Apache NiFi データパイプライン基礎
  • Apache NiFiの環境設定
  • Apache Spark 基礎
  • Apache SparkとApache Zeppelinの概要と環境構築
  • Apache Superset maptoolの使い方
  • Apache Superset 基礎
  • Apache Superset 概要と環境構築
  • Apache Zeppelin 基本機能
  • APIのデモンストレーション
  • Avinton Academy コンテンツガイド
  • AWS CLIをインストールしてコマンド操作しよう
  • AWS CLIを使ってEC2のファイルをS3へアップロードしよう
  • AWS Route 53を使って独自ドメインのWebページを表示させてみよう
  • AWSアカウントの作成と必ずやるべきセキュリティ対策
  • AWSのEC2インスタンスでWordPressブログを公開してみよう
  • AWS入門者向け 初心者が最初に理解すべきEC2とVPCの基本的な用語解説
  • CCNA
  • Certbotを使ってSSL証明書を発行し、HTTP通信を暗号化しよう
  • CISCO 1800ルータセットアップ
  • CSV import & export – Node.js, mySQL – 1
  • CSV import & export – Node.js, mySQL – 2
  • Docker Compose(Nginx + Flask + MySQL)演習
  • Docker Engineのubuntu上へのinstall
  • Docker 概要とセットアップ
  • Docker, Kubernetesの学び方について
  • Dockerコンテナイメージの最適化/ベストプラクティス
  • DockerとApacheを使ってWebサーバーを構築しよう
  • EC2からS3へ自動でぽいぽいアップロードするスクリプトの作成
  • ESP32-CAMのサンプルアプリケーションを実行する
  • 01 – Sparkfun Inventor’s Kit の準備
  • 02 – Sparkfun Inventor’s KitでLチカ
  • 03 ポテンショメータでLEDの点滅間隔をアナログ入力する
  • 04 フォトレジスタで明るさに反応するシステムをつくる
  • 05 LCDに文字列を表示する
  • 06 – BME280とLCDを組み合わせて温度計をつくる
  • ESP32とArduino IDE/PlatfromIOでHello Worldアプリケーションの実行
  • ESP32と超音波センサー HC-SR04 で物体の距離を計測する
  • ESXi – Switchの追加とVLAN
  • ESXi – VyOS
  • ESXi – 小規模ネットワーク 構築
  • Gitとは
  • VS CodeでGitHub Copilotを設定する
  • VSCode リモート開発環境
  • GNS3のセットアップ
  • Kubernetesクラスター上へのOpenVINOモデルサーバーを使用したサンプルアプリケーションのデプロイ
  • Linuxとは
  • NAT
  • NodeJSでWebアプリケーション開発 – React編
  • NodeJSでWebアプリケーション開発 – React編
  • NodeJSでWebアプリケーション開発 – React編
  • NodeJSでWebアプリケーション開発 – Socket.IO編
  • NVIDIA Cumulus VX + GNS3でBGPネットワークのシミュレーション
  • OpenCVのテストプログラム
  • PacketTracerのセットアップ
  • Pandasによる構造化データ分析
  • PCからルータ、スイッチへのSSH接続設定
  • PostGIS exercise
  • PostgreSQL – Python – Apache – Bootstrap
  • MySQLとMySQL Workbench のセットアップ
  • PostgreSQL Setup
  • PostgreSQL – インデックスを利用したパフォーマンス改善方法
  • PostgreSQL – パーティショニングを利用したパフォーマンス改善方法
  • PostgreSQLによるデータ分析
  • postgreSQLへのshp fileのimport
  • Python2.7とOpenCVのインストール
  • Python3.8 と OpenCV のインストール (Ubuntu20.04LTS)
  • Pythonでデータベースを操作する
  • Pythonで画像を分類するプログラムを作成する
  • Pythonによるマルチスレッドプログラミング実践
  • Raspberry Pi 4B のセットアップ
  • Raspberry PiとBME280を使用して温度と湿度、気圧を読み取る
  • REDIS
  • Redux基礎 – 主要な概念と用語
  • Ruby on Rails を MySQLでセットアップ
  • Ruby on Railsによる簡単なウェブアプリケーション
  • SampleアプリケーションのKubernetes上へのデプロイ
  • Scala 基礎
  • scikit-learnとは
  • Spark SQL エクササイズ
  • SparkMLによるKaggle Titanic生存者予測
  • SparkMLによる住宅価格予測
  • SQL 便利な関数
  • Ubuntuの基本設定
  • uhubctlでUSBデバイスのオンオフをコントロール
  • Terraform入門 2 – Terraformのstate管理
  • Terraform入門 1 – TerraformでAWS上にEC2インスタンスを作成する
  • Virtualisation and Container (仮想化とコンテナ) – Ansible, Docker and Kubernetes
  • viエディタ
  • VLAN
  • VMware ESXi サーバー構築
  • Webアプリ開発に欠かせないGoogle Chrome DevToolsの基本
  • Windows Server 2012 R2 Hyper-V
  • YOLOv5を用いた物体検出
Home Avintonアカデミー YOLOv8を用いた物体検出
yolov8

このタスクでは、物体検出モデルYOLOv5での学習を活かして、物体の追跡を行います。
このコンテンツでは、Yolov5を用いた物体検出で学んだことを前提に学習を進めます。
そのため、学習に入る前にYolov5を用いた物体検出を受講することをお勧めします。

物体追跡とは

動画などの連続した画像データ(フレーム)を入力値として、動画中で変化・移動する物体(オブジェクト)の追跡をする技術です。
物体検出との違いで、物体検出ではその瞬間の物体の情報(dog)を検出しますが、物体追跡では各物体を一意のモノとして追跡します。
例えば、車両の交通量調査を行いたい場合、物体検出ではその瞬間に画像に移っている車両の数はわかりますが、次の瞬間に検出した車両の情報を保持していないため、再度別の車両として検出してしまいます。
これに対して、物体追跡では前後フレームで一意の物体かどうかを分析しています。それによって動画を通して特定車両の情報を保持することができ、正しく交通量をカウントすることが出来ます。
物体追跡の使用される場面としては以下が考えられます。

  1. 動画中で、特定の物体の数をカウントしたい。
  2. 動画中で、特定の物体がどのような経路で動いたか分析したい。
    などです。

YOLOv8環境構築

ここからは学習フェーズになります。
開発環境はローカルでも良いのですが、GPUを使いたいのでGoogle Colaboratory を使用することにします。

virtualbox上でGoogle driveとcolabratoryを開く。

1.colabratoryのランタイムというタブをクリックします。

2.ランタイムタイプの変更をクリックします。

3.GPUを選択し、保存する

4.ドライブをマウント

これは、Googleドライブにアップロードするデータセットや学習結果を永続的に保存したいため、Googleドライブをマントします。

1
2
3
from google.colab import drive
drive.mount('/content/drive')
%cd /content/drive/MyDrive/

5.YOLOv8環境構築

YOLOv8を利用するためultralyticsというリポジトリをクローンします。 また、必要なライブラリのインストールも行います。

1
2
3
4
5
import locale
locale.getpreferredencoding = lambda: "UTF-8"
 
!pip install ultralytics
!pip install -U lap

6.テスト動画のアップロード

以下ultralytics配下に追跡に使用するテスト用動画をアップロードします。

今回は、こちらのテスト動画を使用してください。
test.mp4

7.Yolov8での物体追跡

では、実際に物体追跡を使って、テスト動画内の人を追跡していきます。
今回は物体追跡時の推論結果を可視化するために、OpencvのVideoCaptureとVideoWriterを使います。
以下スクリプトを実行して、Yolov8が追跡した結果を動画ファイルに書き出して確認してみましょう。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
import cv2
from google.colab.patches import cv2_imshow
from ultralytics import YOLO
 
file_path = "/content/drive/MyDrive/ultralytics/test.mp4"
output_file_path = "/content/drive/MyDrive/ultralytics/test_tracking_2.mp4"
# テスト動画の読み込み
cap = cv2.VideoCapture(file_path)
 
CLIP_FPS = cap.get(cv2.CAP_PROP_FPS)
BG_COLOR = ( 79, 62, 70)
H = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
W = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
 
codec = cv2.VideoWriter_fourcc('m','p','4', 'v')
video = cv2.VideoWriter(output_file_path, codec, CLIP_FPS, (W, H))
model = YOLO("yolov8s.pt")
 
# テスト動画に対してperson classのみで推論
results = model.track(source="/content/drive/MyDrive/ultralytics/test.mp4", tracker="bytetrack.yaml", classes=[0], persist=True)
 
for result in results:
    ret, frame = cap.read()
    if not ret:
        break
    boxes = result.boxes.xyxy.cpu().numpy().astype(int)
    # 物体が検知されなかった場合
    try:
      ids = result.boxes.id.cpu().numpy().astype(int)
    except Exception as e:
      print(e)
      print("There are no objects")
      continue
 
    cls_list = result.boxes.cls.cpu().numpy().astype(int)
    for box, id, cls in zip(boxes, ids, cls_list):
        cls_name = model.names[cls]
        cv2.rectangle(frame, (box[0], box[1]), (box[2], box[3]), (0, 255, 0), 2)
        cv2.putText(
            frame,
            f"#{id} {cls_name}",
            (box[0], box[1]-5),
            cv2.FONT_HERSHEY_SIMPLEX,
            0.5,
            (0, 0, 255),
            1,
        )
    video.write(frame)
# videoの書き込み/読み込み終了
video.release()
cap.release()

 

書き出された動画を開いて、以下が確認できれば物体追跡は成功です。

  1. 物体ごとにIDが付与されているか
  2. フレームごとに移動している物体のIDが変わっていない

Challenge

  1. yolov8xなどのより重いモデルを試して、精度が向上されるか試してみましょう。
  2. Yolov5を用いた物体検出で学習したようにyolov8で特定のクラスを学習させて、任意の物体を追跡してみましょう。

終わりに

物体追跡は技術としては新しく、特有の課題もあります。
より興味がある方は以下を調べて見ることをおススメします!

  1. 一意の物体を追跡する際の課題について(物体と物体が交差した、物体が障害物に隠れた時など)
  2. 追跡用のアルゴリズムについて

参照

What is Object Tracking in Computer Vision?
マルチオブジェクト・トラッキングUltralytics YOLO

採用情報

採用情報

Categories

  • 相互学習
  • 採用
  • 社員インタビュー
  • 学習&資格取得
  • 技術解説
  • イベント告知
  • 学内説明会&講義
  • 産学連携
  • 就職活動
  • イベントレポート
  • その他
  • 技術ブログ&インタビュー
  • mainpage
  • New Graduates Interviews
  • 中途エンジニア
  • カテゴリーなし
  • ニュースリリース&イベント

Avinton SDGs

SDGsへの貢献

Search

タグ

AI AvintonAcademy Avintonデータプラットフォーム EdgeTech+2022 IFAC2023 Kubernetes Linux Meetup Pandas PM&PMO PyTorch SDGs SF思考 VUCA アカウントマネージャー インタビュー インタビュー記事 エッジAIカメラ エンジニア運動会 キャリアアップ クラスタリング データサイエンス データ可視化 ビジネスメンター フロントエンド ヘルプデスク ボランティア ローカルイベント 人流データ 効率性を高める 国際自動制御連盟 地元応援 地域コミュニティ 基本情報技術者 天野禎章 小島秀藏 展示会 工場 新卒、キャリア 産学連携 産官学連携 社内イベント 社内レポート 社員インタビュー 転職
© 2023 Avinton | All Rights Reserved | プライバシーポリシー
  • サービス
    • Avinton Data Platform
    • エッジAIカメラ
      • 自動車ナンバープレート自動認識システム
    • プライベートクラウド
    • AIサービス開発
    • AIカメラ/画像解析無料体験版
  • 最新情報
    • ニュースリリース&イベント情報
    • 技術ブログ&インタビュー
  • アカデミー
    • Avintonアカデミー
    • Academy on Campus
    • Academy with Platform
  • 採用情報
    • Avintonジャパン 採用ページ
    • 求人一覧
    • よくある質問
    • 新卒採用
  • 企業情報
    • 会社概要
    • 代表からご挨拶
    • SDGsへの貢献
  • お問い合わせ
  • 日本語
    • English (英語)
Avinton Japan