• 日本語
    • English (英語)
Avinton JapanAvinton JapanAvinton JapanAvinton Japan
  • サービス
    • Avinton Data Platform
    • エッジAIカメラ
      • 自動車ナンバープレート自動認識システム
    • プライベートクラウド
    • AIサービス開発
    • AIカメラ/画像解析無料体験版
  • 最新情報
    • ニュースリリース&イベント情報
    • 技術ブログ&インタビュー
  • アカデミー
    • Avintonアカデミー
    • Academy on Campus
    • Academy with Platform
  • 採用情報
    • Avintonジャパン 採用ページ
    • 求人一覧
    • よくある質問
    • 新卒採用
  • 企業情報
    • 会社概要
    • 代表からご挨拶
    • SDGsへの貢献
  • お問い合わせ

駆け出し機械学習エンジニアが1ヶ月で読んだ論文リスト(コンピュータビション)

    Home 社員インタビュー 駆け出し機械学習エンジニアが1ヶ月で読んだ論文リスト(コンピュータビション)
    Avinton Machine Learning Libraries and Frameworks

    駆け出し機械学習エンジニアが1ヶ月で読んだ論文リスト(コンピュータビション)

    By James Cauchi | 社員インタビュー, 技術ブログ&インタビュー | Comments are Closed | 20 11月, 2018 | 1

    はじめまして、駆け出し 機械学習 エンジニアの佐野です。
    2018年の7月からAvintonジャパンに入社し、現在は物体検出のプロジェクトに携わっています。
    Deep LearningのComputer Visionは、技術の変化が非常に激しいです。1年でそこまで進むの?と思うくらい日々技術が進化しています。
    その進化にどうしてもついていこうと思い9月から本格的に、論文を読みはじめました。1か月論文を読むことにチャレンジしてみての感想や読んだ論文のようやくなどをシェアできればと思います。

    また駆け出しの機械学習エンジニア、Webエンジニアから機械学習エンジニアになって日々戦っている方々、これから機械学習エンジニアになろうとしている方々の励みになれば幸いです。

    【目次】
    ・自分のスキルセット
    ・1か月どんなことした
    ・読んだ機械学習論文のまとめ
    ・論文を読んでみての感想

    【自分のスキルセット】
    英語
    英語は前職で使っていて、日常会話であれば問題なくしゃべれるレベルです。リーディングに関しては、英語の記事は長くなければ問題なく読めるくらいのレベルです。
    論文
    全く読んだこともなければ、日本語の論文ですら読んだことがありませんでした。

    【1か月どんなことしたか】
    1か月で合計12本くらい論文を読んでみました。週3本くらいの計算です。目標としては、計算式はわからなくても、自分の口でこの論文の趣旨を説明できるくらいまで読み込みました。時間としては毎日2時間くらいこれに費やしていました。

    読んだ 機械学習 論文のまとめ

    VGG

    畳み込み13層と全結合3層の合計16層で構成されているモデルです。(19層もあります)
    KerasやPyTorchでは、モジュールとしてVGGが実装されているので、簡単に使用することができます。
    最近の論文では、VGGを基礎モデルとして使用していることが多いので、理解しておくことは必須です。

    【参考論文】

    ResNet

    152層で構成されているモデル
    層が深くなると、勾配消失という問題が起きるのですが、このモデルでは残差関数というものを用いて、その問題に対応することできています。
    これもVGGと同じく最新の論文で基礎のモデルとして頻出なので、このモデルも理解することは必須です。

    図:モデル構造【参考論文】

    SSD

    物体検出でよくつかわれるモデルの一つで、Single Shot MultiBox Detector の略です。画像や動画の物体検出で使用されています。
    自分もプロジェクトで使用しており、大変お世話になってます。

    図:モデル構造【参考論文】

    Image Captioning

    CNNとRNNを組み合わせることで、入力の画像に対して、その画像の説明文を返すというものです。CNNとRNNをつなぎ合わせる部分には、Embedding layerを使い、RNNでも受け取れる情報であるベクトルに変換しています。
    最近では、ここからさらに発展して、画像と質問文を入力として渡すと文章で答えが返ってくるというVQA(Visual Question Answering)という技術も発展してきています。

    図:文字が出力されるまでの流れ【参考論文】

    U-Net

    医療用のセグメンテーションを行うのに適しているモデルです。
    プーリング層などを通すと物体の位置情報が不明確になるのですが、アップサンプリングという技術を使うことで、物体の境目をはっきりさせることができます。
    ちなみに、モデルを図で見ると「U」に見えることから、U-Netと呼ばれているみたいです。

    図:モデル構造【参考論文】

    Mask R-CNN

    物体検出、セグメンテーション、ポーズ推定などいろいろできるモデルです。
    モデルは、Faster R-CNNをベースに構築されており、RoI Alignを使うことで、Faster R-CNNのRegion Proposal Networkで問題になっていたピクセルレベルのズレを解消することができるようになっています。

    図:出力するまでの流れ【参考論文】

    Clique Net

    唯一今年の論文です。
    情報の流れを最適化するために、すべての層がinputとoutput両方を兼ね備えています。
    通常のCNNとは異なった仕組みで、成果を出しています。今後は、このような一風変わった構造のCNNが出てくるのかもしれません。

    図:出力するまでの流れ【参考論文】

    【論文を1ヶ月読んでみての感想:論文を読むことはおもしろい】

    論文を1ヶ月読んでみての感想は、「論文を読むことはおもしろい」です。
    もちろんはじめはつらいですが、知識がついてくると興味の幅も自然と広がります。
    「論文を読む」ということに対して、難しいという印象を持っている方が多いと思いますが、
    「どんなことをこの論文では試したのか」「筆者の主張はなんなのか」くらいはどなたでも理解できると思います。
    もちろん、細かいところの数式や引用をすべて把握することになるともっと時間がかかると思いますし、専門性もあがりますのでそこは難しいです。
    機械学習エンジニアにとっては、論文を読んで、実装できることは一つの技術になると思うので、最初の一歩をぜひ踏み出してください!!ご一読ありがとうございました!

    あなたも、Avintonでこのような最先端技術を習得し活用してみませんか?

    社員の成長を導きながら、AIやビッグデータなどの最先端技術をプロジェクトに活用していくことが私たちのビジョンです。Avintonの充実した技術研修でスキルアップを図り、あなたのキャリア目標を一緒に達成しませんか?

    採用情報
    機械学習, 深層学習, キャリア, 未経験, 技術

    Related Post

    • AIの時代における 新卒エンジニアの挑戦

      AIの時代における新卒エンジニアの挑戦

      By Avinton rk | Comments are Closed

      Read more

    • 社会人→専門学校→新卒エンジニア! 私のキャリアアップの道

      社会人→専門学校→新卒エンジニア!私のキャリアアップの道

      By Avinton rk | Comments are Closed

      Read more

    • デザイナーからエンジニアへの転身:Avintonでの挑戦と成長

      デザイナーからエンジニアへの転身:Avintonでの挑戦と成長

      By Avinton rk | Comments are Closed

      Read more

    • ITエンジニアが語る 真鶴農業体験の魅力

      疲れが取れる?!新卒エンジニア3年目が語る真鶴農業の魅力

      By Avinton rk | Comments are Closed

      Read more

    • エンジニアインタビュー/自動車・AI・IT業界の枠を超えたエンジニアを目指して

      新卒エンジニア3年目にインタビュー/自動車・AI・IT業界の枠を超えたエンジニアを目指して

      By Avinton rk | Comments are Closed

      Read more

    採用情報

    採用情報

    Categories

    • 相互学習
    • 採用
    • 社員インタビュー
    • 学習&資格取得
    • 技術解説
    • イベント告知
    • 学内説明会&講義
    • 産学連携
    • 就職活動
    • イベントレポート
    • その他
    • 技術ブログ&インタビュー
    • mainpage
    • New Graduates Interviews
    • 中途エンジニア
    • カテゴリーなし
    • ニュースリリース&イベント

    Avinton SDGs

    SDGsへの貢献

    Search

    タグ

    5G AIエンジニア Apatch AvintonAcacemy Avinton データプラットフォーム AWS Lambda Big Data Digital Transformation istio Kubeflow Kunernetes LLM LTE Python Ruby SE SES Spark TensorFlow YOLOv8 アントレプレナー イベント告知 インフラエンジニア キャリアサポート サイバー攻撃 システムエンジニア スタートアップ セキュリティエンジニア データエンジニア データサイエンティスト バックエンド ベテランエンジニア ベンチャー マイクロサービス 中途採用 大学&専門学校 学習 強化学習 持続可能な未来 教育 新卒 田中研之輔 社会貢献 経団連 顔認証
    © 2023 Avinton | All Rights Reserved | プライバシーポリシー
    • サービス
      • Avinton Data Platform
      • エッジAIカメラ
        • 自動車ナンバープレート自動認識システム
      • プライベートクラウド
      • AIサービス開発
      • AIカメラ/画像解析無料体験版
    • 最新情報
      • ニュースリリース&イベント情報
      • 技術ブログ&インタビュー
    • アカデミー
      • Avintonアカデミー
      • Academy on Campus
      • Academy with Platform
    • 採用情報
      • Avintonジャパン 採用ページ
      • 求人一覧
      • よくある質問
      • 新卒採用
    • 企業情報
      • 会社概要
      • 代表からご挨拶
      • SDGsへの貢献
    • お問い合わせ
    • 日本語
      • English (英語)
    Avinton Japan