┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2024年6月号 (Vol. 17, No. 3)
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

本号では、国際会議ICDE 2024、PAKDD 2024の参加報告をご寄稿いただいており
ます。会議の動向やご自身の研究内容などのご紹介となります。

本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容
についてご意見がございましたらnews-com [at] dbsj.orgまでお寄せください。

                                             DBSJ Newsletter 編集委員会
                                               (担当編集幹事 宮森 恒)

========================================================================

----
目次
----

1. ICDE 2024 参加報告
  天方 大地(大阪大学)

2. PAKDD 2024 参加報告
  佐藤 嶺(株式会社KDDI総合研究所)

========================================================================

■1■ ICDE 2024 参加報告
                                                  天方 大地(大阪大学)

 オランダのユトレヒトで開催されたIEEE International Conference on Data
Engineering (ICDE) 2024 に参加しました。報告の機会を頂戴したため、ここで
報告いたします。ICDEはNewsletterでも毎年報告がありますが、SIGMODとVLDBを
あわせたデータベース三大会議の一つです。(採択論文を俯瞰すると、SIGMOD・
VLDBよりもスコープは広いように感じます。)2024年からICDEはin-person開催
に戻り、すべての発表が現地で行われるようになりました。オランダ渡航に関し
ても特別な書類は必要なかったので、コロナ禍前にようやく戻った実感がありま
した。発表形式は口頭および(オプションとして)ポスターでした。最近の多く
のAI・ML国際会議ではポスター発表がデフォルトで、口頭発表が一部の採択論文
となっておりますが、ICDEは全ての採択論文に口頭・ポスター発表の機会を与え
ています。これはAI・ML会議と採択論文数に大きな差があるからだとは思います
が、プレゼンテーション・ディスカッション力の向上という観点から、学生の方
々にとっては貴重な機会になるのではないかと思います。(一方で10並列セッシ
ョンということで、ポスターセッションの盛り上がりは。。。でした。)投稿に
ついては、今年も2-round制が採用されていました。また、最初の判定は、
Accept/Revise/Rejectとなっており、Reviseとなった場合は改定論文を投稿して
最終結果を待つことになります。https://icde2024.github.io/program.html
ら眺めていただけると分かると思いますが、採択論文はクラシックな問題に機械
学習技術を取り入れたものが非常に増えています。一方で、
https://icde2024.github.io/awards.html から分かるように、受賞論文は(人
工知能技術に依らない)クエリ処理やDBMSに関するもので、理論やシステマチッ
クな技術も非常に重要視されている様子です。

 ICDE2024のResearch Trackに私の単著論文「Independent Range Sampling on
Interval Data」が採択されたので、ここで紹介させていただきます。この論文
では、(区間データ上の)範囲検索に対して、結果のサイズをコントロールでき
ない(最悪は全てのデータ)、アルゴリズムの時間計算量が結果のサイズに比例
してしまう(つまり、nをデータ数にしたときO(n)時間かかる可能性がある)、と
いう問題点を挙げています。また、大量のデータが出力されるのであればそれら
のランダムサンプルでOK、という想定の下、如何に効率的にランダムサンプルの
みを出力できるか、という課題に取り組みました。この課題に対して、ポリ対数
時間を無視したときに時間計算量がサンプル数のみに比例するアルゴリズムが存
在することを証明し、その実践的実行時間も非常に早いことを示しました。この
研究成果は初めにPVLDBに投稿したのですが高評価は得られず、ICDEに投稿した
ところ、Revision無しの一発採択となりました。(ネガティブな査読者がいない
場合はRevision無しだったのかもしれません。この辺りのルールは把握できませ
んでした。)特に、理論的な性能保証とそれに伴う既存技術に対する優位性の証
明が高く評価されました。採択・不採択は時の運の影響もあると思うので、採択
に値する自信がある場合、根気強く投稿し続けることが大事だと改めて感じます。

 執筆時点では来年のICDEに関するオフィシャルな報告はされていないのですが、
香港開催の予定とのことです。ICDEはデータベース分野のトップ研究者が集まり、
興味深い発表が数多く行われるイベントです。自身が気になる研究発表を聞きに
来る参加者も多数見受けられます。本会議に論文を通した方々は参加必須なため、
トップ会議に採択されるためのノウハウ等を聞くことも可能です。日本のデータ
ベース分野を盛り上げるためにも投稿・参加を検討してみてはいかがでしょうか。

著者紹介:
天方 大地(大阪大学大学院情報科学研究科)

2015年大阪大学院情報科学研究科博士後期課程修了(情報科学博士)後、同年同
大学院情報科学研究科マルチメディア工学専攻助教となり、現在に至る。データ
ベース、データマイニング、および機械学習における高速アルゴリズムに関する
研究に従事。2019年度上林奨励賞、IEEE Computer Society Japan Chapter
Young Author Award 2020、2022年度マイクロソフト情報学研究賞、2023年度科
学技術部門の文部科学大臣表彰を受賞。IEEE、ACM、日本データベース学会、情
報処理学会の各会員。

------------------------------------------------------------------------

■2■ PAKDD 2024 参加報告
                                       佐藤 嶺(株式会社KDDI総合研究所)

 第28回PAKDDは2024年5月7日から10日まで台湾・台北で対面開催された.
PAKDD(The Pacific-Asia Conference on Knowledge Discovery and Data Mining)
はデータマイニング分野の難関会議の一つである. PAKDDはトップ国際会議KDDの
アジア・太平洋地区版として位置付けられ, データマイニング, データウェアハ
ウジング, 機械学習, 人工知能, データベース, 統計学, 知識工学, 可視化, 意
思決定システム, アプリケーションなど, KDD関連分野全般からの新しいアイデ
アやオリジナルな研究成果, 実践的な開発経験を共有することを目的としている
. プログラムでは, 最新の動向を反映した基調講演, 論文発表, チュートリアル,
ワークショップが用意された.

 基調講演では, Google DeepMind, ミネソタ大学, アリゾナ州立大学より,これ
までの言語モデルからLLMへの進化, 説明可能AI, 環境課題に取り組むための機
械学習, に関しての講演がそれぞれ1時間程度あった.

 今年の投稿数は, 720の論文が投稿され, 175件が採録された. その内訳は,オ
ーラル枠の採録数が133(採録率18.5%), ポスター枠の採録数が42(採録率24.3%)
となった. 査読プロセスは, 500名以上のプログラム委員と100名のシニアプログ
ラム委員によって実施された. 査読はダブルブラインド方式であり,一つの論文
あたりに最低2名以上, 最大5名のレビューワがついた. 投稿数における国別の著
者数は, 1位が中国(623名), 2位が米国(237名), 順にオーストラリア, インド,
台湾, 韓国で, 7位に日本(70名)がランクインした. また, 8位以降ではカナダや
ドイツ, フランスなど北米・欧州からも投稿があった. 投稿された論文の傾向と
して, 順に, 深層学習, レコメンド推薦, 生物統計, グラフに関するアルゴリズ
ムが大半を占めた.

 我々の研究「QWalkVec: Node Embedding by Quantum Walk」はオーラル枠に採
択された.量子ウォークはランダムウォークの量子版であり, この量子ウォーク
と機械学習を組み合わせた新規手法を提案したものである. グラフのノードラベ
ルを予測するノード分類問題を題材にしており, ノードラベルを予測するための
特徴量をグラフ構造から生成し, 特徴量の品質の比較検証を行った.  node2vec
と呼ばれるランダムウォークベースの手法をベースに, 幅優先探索と深さ優先探
索を両立する量子モデルを考案した. この量子モデルが, 一部のデータセットで
高精度にノード分類ができることがわかった.

 採録するために工夫した点としては, 共著者と頻繁に議論を行い, 論文の
contributionを明確にしたことである. なぜ, この手法がよいのか簡易実験を交
えて提案手法に詳しく記述したことで, 全レビューワから筋が通っていて読みや
すいという評価が得られた. また他の研究を聴講していて感じたこととして,
contributionを1枚のスライドに明確に示してあると, 異分野であっても何をし
ているのか理解しやすかった.

 会議全体の雰囲気はフランクで楽しく, 博物館のツアーやバンケットも含まれ
ており, 海外・日本の研究者の方々とたくさん話しができたので, とても刺激に
なり, モチベーションがあがった. 次回の開催はオーストラリアのシドニーで開
催される見通しである.

著者紹介:
佐藤 嶺(KDDI総合研究所)

2021年東京工業大学大学院卒業(学術)後, 同年, KDDI株式会社に入社.  2022
年よりKDDI総合研究所AI部門に出向.  量子機械学習と量子アルゴリズムの理論
研究に携わっている. 日本物理学会会員.

========================================================================