CVPR2024ワークショップにて受賞＆学会に現地参加！

2024年7月31日 13:50

こんにちは。note編集部の箕輪です。6月17日～21日、アメリカのシアトルで開催されたCVPR2024に、当社社員が参加しました。

■CVPRって何？

CVPRとはコンピュータビジョン分野でもっとも権威のある国際会議の1つであり、1週間にわたってメインカンファレンス（2,719件）、ワークショップ（123件）、チュートリアル、企業デモなどが行われます。

当社からは、ワークショップのうち「8th AI City Challenge」に技術創発研究所　吉田さんが、「VAND2.0: Visual Anomaly and Novelty Detection Challenge」に、同じく技術創発研究所　都築さんがそれぞれ参加しました。

■世界2位を受賞！

ワークショップ内のコンペでは、設定されたタスクと指標に基づき、約1～2カ月の期間で各チームが精度を競います。今回挑戦したコンペのタスクは、研究所が日ごろから取り組んでいる土木分野でのAI適用における課題解決に通じるものがあり、研究の成果を生かせるチャレンジだったため参加を決めたとのこと。

これまでの研究活動で培ってきた知識と技術を活用して精度改善に取り組んだ結果、吉田さんは2位（精度では世界一！）を獲得し、ワークショップの論文・プレゼンテーションに採択され、都築さんも精度4位でHonorable Mentionsを受賞しました。

世界的に影響力が高い国際会議にて結果を残したことにより、当社技術創発研究所のAI技術が優れたものであることが示されました。

■各ワークショップの紹介と参加者コメント

【8th AI City Challenge】2位を受賞した吉田さんのコメント

AI City Challengeは高度道路交通システム（ITS）の高度化を目指して、交通に関する解析の精度を競うNVIDIA主催のワークショップです。

今年で8回目の開催で、本年は以下の5つの競技で争われました。

①マルチカメラの人流解析
②交通事故動画のcaptioning
③ドライバーの運転動作認識
④魚眼カメラによる道路異常検知
⑤ヘルメット非着用のバイク運転者検知

各競技には計721チームが参加し、当社が参加した①人流解析は421ものチームが参加していました。

本解析はビデオカメラに映った人の動線をデータ化するもので、Digital twinの高度化には欠かせない技術です。技創研ではかねてより社会計画部で実施されてきた人流調査業務の自動化・高度化に向けてシングルカメラでの人流解析技術の検討を進めていましたが、このChallengeを契機にマルチカメラ技術の検討に着手しました。

Challengeではマルチカメラでの人物照合アルゴリズムを新たに検討するだけでなく、従来のシングルカメラ人流解析アルゴリズムを抜本的に改善することで、精度としては1位、全体で2位の成績を収めることができました。

※当社の提案手法はまちづくり分野での調査を想定した事後解析用のアルゴリズムであったため、リアルタイム解析のボーナスポイントが得られず、精度2位のチームに惜敗しました。

Challengeの期間は2024年1月22日～2024年3月25日という短期間でしたが、事前準備やChallenge終了後の論文執筆作業、発表スライドの準備などを合わせると、その取り組み期間は半年以上にも及びました。

プログラムの準備などもままならない状態でChallengeは開始したのですが、既往研究で培った基礎的知見から得たアイデアが上手く作用し、好成績を収めることができました。

本ワークショップに参加してみて、組織的に取り組む中国チームの勢いを強く感じました。

共同執筆者の数や論文の作図のクオリティなどからもその差は明確で、明らかに量では勝てないという印象を受けました。

その反面、研究の質は技創研にも優れたものがあり、計算科学分野で世界的に通用する点もあるように思いました。

本年はワークショップの参加となりましたが、Main Conferenceでの口頭発表ができるよう、今後も研究に尽力します！

▼ワークショップウェブサイト

▼プレスリリース

【VAND2.0: Visual Anomaly and Novelty Detection Challenge】4位を受賞した都築さんのコメント

VAND2.0は、Intelがスポンサーを務める、名前の通り画像異常検知に関するワークショップです。以下2つのChallengeカテゴリで構成され、このうち研究所が参加したのはカテゴリ1です。

・1 － Adapt & Detect: Robust Anomaly Detection in Real-World Applications
・2 － VLM Anomaly Challenge: Few-Shot Learning for Logical and Structural Detection

Challenge期間は4月15日～6月1日、コンペ参加者は420人、カテゴリ1へのプロジェクト提出数は16件でした（提出要件を満たさなかったため拒否されたプロジェクトも多くあったそうです）。

ここでの異常検知とは、工場の不良品検知のように、正常な状態から逸脱した画像領域を検出することです。AIによる異常検知手法は製造業や医療分野を中心に研究が進められてきましたが、既存手法の多くは特定の条件下で取得された画像のみを用いて訓練および検証がされています。しかし、実世界ではカメラの角度や照明、ノイズなどの外部変化の影響によって、常に同じ条件下で画像を取得することは困難です。こうした背景から、カテゴリ1では、実世界で起こり得る外部変化に対してロバストな異常検知モデルを開発することを目標としています。

建設コンサルタントの業務では、対象物は基本的に屋外環境にあります。それらにAI技術を適用する際、天候や日照、外観の経年的な変化などにより、精度が不安定になってしまうことが大きな問題とされています。このように、Challenge目標と土木分野における問題の親和性が高いことから、今回コンペに参加しました。

そのため、Challengeのために新しく手法を開発したのではなく、これまでインフラ、特に河川護岸を対象に実験検証を行ってきた手法をベースとしてモデルを作成しました。護岸画像で良好な精度を出していた異常検知手法は、Challengeで使用されたテストデータ（さまざまな外部変化を想定した工業製品画像）に対しても効果的に働き、結果、全体で4位の精度を達成して入賞することができました。まだまだ課題は多く残っていますが、結果を残せたことで自信につながっています。

今回、国際会議への参加自体が初めてということもあり、何もかもが刺激的な1週間でした。今後の異常検知研究に活用できるアイデアも見つけることができ、この経験をきちんと役立てていきたいと思います。

▼ワークショップウェブサイト