┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

┃ 日本データベース学会 Newsletter

202210月号 ( Vol. 15, No. 5 )

┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

 

本号ではICML 2022KDD 2022ICPR 20223件の国際会議の参加報告をご寄稿い

ただきました.それぞれの会議の様子や招待講演の内容,ご自身が発表された研究

内容などについて紹介していただいているため,ぜひご覧いただければ幸いです.

 

本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容

についてのご意見がございましたらnews-com[at]dbsj.orgまでお寄せください.

 

                                  日本データベース学会 電子広報編集委員会

                                               (担当編集委員 丸橋 弘治)

 

========================================================================

----

目次

----

 

1.ICML 2022 参加報告

竹森 翔(富士通株式会社)

 

2.KDD 2022 参加報告

高橋 大志(株式会社NTTドコモ)

 

3.ICPR 2022 参加報告

植田 涼介(京都大学)

 

========================================================================

 

■1■ ICML 2022 参加報告

                                                竹森 翔(富士通株式会社)

 

2022717日から723日までボルティモアで開催されたICML 2022(The Thirty-

ninth International Conference on Machine Learning)にオンラインで参加しま

した.今年のICMLは,基本的には現地での参加が想定されていて,物理的に会場

を訪れることのできない参加者のために発表動画やチャットでの質問を受け付け

るなどの工夫が用意されました.ICML 2022では5630本の投稿があり,そのうち1117

short presentationとして,118long presentationとして採択されました.

私の「リスク回避のためのカーネル・バンディット問題」に関する主著論文がshort

presentationとして採択され,オンライン(virtual only pass)で参加しました.

 

ICML 2022では,査読者の負担や査読の質を改善する試みがなされました.具体的

には,AAAIなどの他の国際会議でも導入されている2フェーズ査読がICMLでも導入

されました.2フェーズ査読では,最初の査読で1つの論文に対し2人の査読者が割

り当てられ,論文を2番目のフェーズに進めるべきか決定されます.2番目のフェ

ーズに進んだ論文は,さらに追加の査読者が割り当てられ,議論に加わったり,

rebuttalフェーズで著者たちに質問したりします.査読システムで印象的だった

のが,査読スコアが著者やmeta reviewerから見えない点でした(スコア以外は見

ることができます).理由の一つとしては,meta reviewerが査読スコアだけで判

断しないようにするためだと思われます.

 

採択された論文の発表の他に,創薬やヘルスケア,気候変動への機械学習の応用

,機械学習論文の再現性,因果推論についてなど機械学習に関する(理論・応用の

どちらも含む)多岐にわたるトピックについて4件の招待講演,9件のチュートリア

ルなどが行われました.その中で特に,逐次的意思決定(contextual bandit

強化学習などを含む一般的な問題設定)の理論に関するDylan FosterAlexander

Rakhlinによるチュートリアルが印象に残りました.彼らの最近のプレプリントを

基にした講演で,逐次的意思決定に対して"decision estimation coefficient"(DEC)

と呼ばれる問題の複雑性を表す量が定義され,それが,サンプル効率性の良い学

習ができるかどうかを判定可能にするものであることが紹介されました.これま

では,このような解析は各々の特定の問題(例えば線形bandit)に対して与えられ

ていたのですが,彼らは一般的な問題設定に対して複雑性を表す量を与えました

DECが彼らの研究の中で自然に得られたことも説明され,理想的な研究の流れで

あるように思いました.

 

私は事前に作成した動画により,「リスク回避のためのカーネル・バンディット

問題」について発表しました.通常のカーネル・バンディット問題(ベイズ最適化

と呼ばれることもある)は出力の平均を最適化(最大化)するよう入力を探索します

が,リスク回避のためには,出力の分布を考慮した量(例えば,CVaRMean-Variance)

などを最適化することが重要になります.例えば,Mean-Varianceを考慮した場合

,入力に依存する出力の確率分布をモデル化し,出力分布の分散が小さく,平均

が最大化されるように入力を探索する問題設定になっています.既存研究(特にCVaR

の場合)では,強い制約のもとでしか動作しないアルゴリズムが提案されていて,

今回の提案手法はより広い場合に適用できる実用的な手法になっています.採択

論文ではリスク回避のためのカーネル・バンディット問題のための枠組みを提案

していて,似た枠組みが他のカーネル・バンディット問題などに広く適用可能だ

と思うので,関連研究が盛り上がることを期待しています.

 

去年のICMLGatherTownによるオンラインのポスター発表があったのですが,残

念ながら今年はオンラインの発表は動画とチャットのみでした(オンラインのポス

ターセッションは当初予定されていましたが,参加者たちの投票による十分な支

持がなかったので,なくなりました).可能であれば,来年は実際に現地を訪れて

参加者と議論してみたいと思います.

 

最後に,ICML2023は韓国ソウルで724日から30日まで開催される予定です.

 

 

(竹森 翔 富士通株式会社)

 

------------------------------------------------------------------------

 

■2■ KDD 2022 参加報告

                                          高橋 大志(株式会社NTTドコモ)

 

2022814日から18日まで開催された,KDD2022 (28th ACM SIGKDD International

Conference on Knowledge Discovery & Data Mining) に参加してきました.KDD

はデータマイニング・データサイエンス分野のトップカンファレンスです.第28

回目となる今年は3年ぶりとなる現地開催で,開催地はワシントンD.C.でした.合

2122人が参加したとのことです.私は機械学習分野の学会に参加することが多

く,KDDに参加するのは今回が初めてだったのですが,非常に有意義な体験ができ

ました.

 

KDDでは幅広いトピックを扱っており,学術的貢献を評価するResearch Track,機

械学習アルゴリズムの社会実装を評価するApplied Data Science (ADS) Track

併設されています.今年のResearch Trackへの投稿数は過去最高の1695件で,そ

のうち254件が採択されました (採択率15.0%).投稿数は増加傾向にあり,過去最

高を記録した去年の1541件から約10%増加しています.また,KDDの特徴として,

KDD Cupという世界最大のデータ分析コンテストが併設されています.

 

採択論文の傾向ですが,Research Trackではグラフを扱っている研究が,ADS Track

では推薦を扱っている研究が特に多かったです.公平性などの実用上重要なトピ

ックも存在感がありました.また,Transformerといった機械学習分野で注目を集

めている技術も広く使われている印象を受けました.私は現在音声認識のチーム

に所属しているため,音声認識に関する研究をいくつか聴講しました.プライバ

シーを考慮した上で追加学習を行う研究や,音声認識に対する敵対的攻撃を扱っ

た研究などがあり,機械学習分野の学会と比べて,実用上重要になってくる課題

に取り組んでいると感じました.余談ですが,ADS Trackは「System」,「User

,「Product」,「Service」,「Framework」,「Commerce」といった単語がタイ

トルに使われることが多いようです.インダストリアルに近いKDDならではだと思

います.

 

続いて,KDD Cupについて説明します.今年はAmazon主催の「Amazon Product Search

と,Baidu主催の「Wind Power Forecast」という2つのコンテストが行われました

.私が所属しているNTTドコモでは,有志がAmazon Product Searchに参加してお

り,9位入賞されたとのことでした.その方達は残念ながら現地参加できないとの

ことで,代わりにワークショップを聴講しました.Amazon Product Searchでは,

英語,日本語,スペイン語などの複数言語における検索クエリとその結果がデー

タセットとして提供されています.このデータセットを用いて,Amazonの商品検

索の改善に直結するような3つのタスクを解くのが,本コンテストの目的です.各

チームの手法を見ていたのですが,Transformerを用いて特徴抽出し,LightGBM

用いて予測を行うという方法が主流のようでした.現在の自然言語処理における

分析手法を知ることができ,勉強になりました.

 

私自身はResearch Trackで「Learning Optimal Priors for Task-Invariant

Representations in Variational Autoencoders」というタイトルの論文を紹介し

ました.Variational Autoencoders (VAE) は教師なし表現学習に用いられる手法

です.VAEは強力なのですが,データ数が少ない場合に性能が低下するという問題

があります.この問題を解決するために,複数のタスク上でVAEを学習する試みが

行われています.この時,表現がタスクに依存しないようにすることが重要なの

ですが,多くの場合は依存してしまうことが知られています.本研究では,この

タスク依存性の原因を調査し,従来用いられていた単純な事前分布が一因である

ことを明らかにしました.その上で,タスク依存性を減らすために最適な事前分

布を提案しています.発表後に式変形について熱心に聞きに来てくれる人がいて

,とても嬉しかったです.

 

久しぶりの現地開催となったKDDですが,コロナ流行前の学会の雰囲気に戻りつつ

あるという印象を持ちました.ポスターセッションもオーラルセッションも盛況

でした.会場内では料理が提供されていて,参加者が料理を片手にコミュニケー

ションを取っているのを頻繁に見かけました.コロナ対策もしっかり行われてお

り,会場内ではマスク着用を徹底するように呼びかけられていました.今後も感

染対策を徹底した上で現地開催する流れが続き,人がどんどん戻っていくのでは

ないかと思います.来年はロサンゼルス開催とのことですので,興味のある方は

ぜひ参加または論文投稿を検討されてはいかがでしょうか.

 

(高橋 大志 株式会社NTTドコモ)

 

------------------------------------------------------------------------

 

■3■ ICPR 2022 参加報告

                                                   植田 涼介(京都大学)

 

2022821日から25日にかけて開催された26th International Conference on

Pattern Recognition (ICPR 2022) に参加しました.ICPRはパターン認識に関す

る国際会議の一つで,2年ごとに開催されています.今回のICPR 2022は,カナダ

・モントリオールでの現地とオンラインのハイブリッドで開催され,口頭発表が

147件,ポスター発表が188件実施されました.

 

ハイブリッドでの開催のため,口頭発表は半分ほどが事前に録画されたプレゼン

テーションビデオによるものでした.一方,ポスター発表は私の見る限り全て現

地で行われており,議論も活発に行われている印象を受けました.ただし,質問

は現地の参加者からのものが大半で,ハイブリッドでのコミュニケーションの難

しさを感じました.

 

パターン認識がメインの学会であるため,画像や音声データを対象とした実応用

の研究が非常に多く見られました.個人的に特に印象に残っているのは,複数の

Keynoteで取り上げられた,顔認証・歩行認証・虹彩認証などの生体認証の分野の

研究です.クリーンなデータ(グリーンバックで真っ直ぐ歩く動画など)から始

まり,ノイズの大きいデータ(実際の街の固定カメラなど)への適応・実応用で

のデータ収集方法など,現実的な課題とその解決についての話が多く,非常に興

味深かったです.

 

私は「Mitigating Observation Biases in Crowdsourced Label Aggregation」と

いう研究を口頭発表しました.この研究はアノテーションを統合する問題に対し

て,因果推論でよく使われる傾向スコア逆重み付けを導入し,精度の高いラベル

付きデータセットの構築を目的としています.ICPRではアノテーションを対象と

した研究は多くありませんが,「Artificial Intelligence, Machine Learning

for Pattern Analysis」トラックに投稿し,採択されました.私が発表したセッ

ションは発表者の現地参加の割合が高く,質疑応答も活発に行われました.初め

ての国際会議での発表だったので,良い経験になりました.

 

次回のICPR 2024はインド・コルカタで開催されるそうです.新型コロナウイルス

の流行が収まり,より活気ある状態で開催できることを願っています.

 

(植田 涼介 京都大学)

 

========================================================================

 

---

丸橋弘治

富士通株式会社

maruhashi.koji@jp.fujitsu.com