┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2023年10月号 ( Vol. 16, No. 5 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
本号では ICML 2023,KDD 2023,VLDB 2023 の3件の国際会議の参加報告をご寄
稿いただきました.それぞれの会議の様子や招待講演の内容,ご自身が発表され
た研究内容などについて紹介していただいております.ぜひご覧いただければ幸
いです.
本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容
についてのご意見がございましたらnews-com[at]dbsj.orgまでお寄せください.
DBSJ Newsletter 編集委員会
(担当編集委員 斉藤 和広)
========================================================================
----
目次
----
1. ICML 2023 参加報告
小西 達也(株式会社KDDI総合研究所)
2. KDD 2023 参加報告
竹内 孝(京都大学)
白上 龍(住友電工システムソリューション株式会社)
西田 遼(産業技術総合研究所)
3. VLDB 2023 参加報告
山田 浩之(株式会社Scalar)
========================================================================
■1■ ICML 2023 参加報告 小西 達也(株式会社KDDI総合研究所)
7月末にアメリカはハワイで開催されたICML 2023 (International Conference
on Machine Learning) に,ポスター発表のため現地参加してきました.コロナ
禍を経て2022年から現地開催が再開されたICMLですが,今回の開催は7,764名
(うち40%が学生)の参加者,1,828件のポスター発表などを擁し,機械学習系国
際会議の中でも最大級のものです.国別の参加者数では,日本は米国,韓国,英
国,中国,カナダ,ドイツに続いて7番目の多さ.開催期間は計7日間で,最初の
2日はExpo (Industry) Day(スポンサー企業によるセッション)とチュートリア
ル,3日間の本会議のあとにワークショップが2日間という充実の1週間でした.
Expo Dayでは差分プライバシー(Differential Privacy)や基盤モデル活用のた
めの製品紹介など,AIの実応用上の課題を扱うスポンサー企業からの発表がメイ
ンです.チュートリアルでは昨今のAI技術の基礎となっているマルチモーダル学
習や強化学習,自己教師あり学習などの技術について各2時間にわたり詳細な講
義が行われました(講演によってはスライドが公開されているので,ご興味のあ
る方は是非お調べください).本会議では,ポスター発表(3日間で6つのセッシ
ョンに分割)と一部の論文について口頭発表がありました.各ポスターセッショ
ンは1.5時間ほどしかないので,めぼしい論文リストを予め作っておくと時間切
れにならず安心ですが,一方で,人だかりのあるポスターに偶然巡り会うのもリ
アル開催の醍醐味でもあります.内容はやはりLLM・基盤モデルに関する研究が
大半を占めていましたが,グラフ学習,連合学習,強化学習のようなトピックも
多く目に留まります.ワークショップでは,特定の技術や分野に絞った発表や議
論が集中的に行われました.ヘルスケアのような見慣れたものから天体物理学へ
の適用のようなものまであり,実に幅の広いラインナップです.
私は"Parameter-Level Soft-Masking for Continual Leanring"というタイトル
でポスター発表を行いました(イリノイ大学シカゴ校で客員研究員として共同研
究した成果です).継続学習(Continual Learning)における主要課題である「
破滅的忘却の抑制」「知識転移の促進」に加えて,従来研究で見過ごされてきた
「新しいタスクに対する表現能力の維持」という要件を同時に満たすsoft-
maskingという手法を提案しています.
発表会場とは別に設営されていた展示会場では,スポンサー企業によるブース出
展もありました.やはり目を引くのは基盤モデルなどのAIモデルを運用するサー
ビス(=AIOps)の出展です.複数社が軒を連ね,APIを利用したモデルの管理ツ
ールについてデモを交えて宣伝をしていました.参加者の興味も高く,常に人だ
かりができていたのが印象的です.多くのブースでは「インターン募集」の張り
紙も見られ,優秀な学生を採用する場としても一役買っているようです.また,
会議中にお話しした方の中でも,調査目的で聴講参加している人を多く見かけま
した(海外企業,日本企業とも).
次回のICML 2024はオーストリア,ウィーンで7/21〜27の日程で開催予定です.
現時点では今年と同じくVirtual Pass(オンライン参加)も可能なようですが,
是非現地での参加をおすすめします.
著者紹介:
小西 達也(株式会社KDDI総合研究所)
2017年東京大学大学院情報理工学系研究科修士課程を修了後,KDDI株式会社に入
社.2018年より株式会社KDDI総合研究所へ出向.コミュニティ行動変容やグラフ
ニューラルネットに関する研究に従事したのち,継続学習についての研究を開始
.2021年10月より約2年間イリノイ大学シカゴ校にて客員研究員.
------------------------------------------------------------------------
■2■ KDD 2023 参加報告 竹内 孝(京都大学)
白上 龍(住友電工システムソリューション株式会社)
西田 遼(産業技術総合研究所)
KDD 2023 (29TH ACM SIGKDD CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA
MINING)が,2023年8月6日から8月10日までアメリカのカリフォルニア州ロングビ
ーチで開催されました.KDD 2023はResearchトラックとApplied Data Scienceト
ラックの2本立てとなっており,いずれのトラックでも採択された研究は口頭と
ポスターで発表が行われました.本会議では3件の基調講演がEd Chi氏 (Google)
,Eric Horvitz氏(Microsoft),Mihaela van der Schaar(University of
Cambridge)より行われました.ワークショップはフルデイが10件,ハーフデイ
が24件,チュートリアルはレクチャー形式が26件,ハンズオン形式が8件が開か
れるなど盛況な様子で,現地参加のみの開催で参加者数は2250人となったそうで
す.これほど大規模な国際会議を実行するためには,主催者側が準備に費やす労
力も膨大となるようで,Organizing Committeeでは,週1回3時間のミーティング
は30回行われ,General Chairに至っては週10時間ほどの作業を50週間行ったそ
うです.
さて,論文の投稿と採択に関する内訳が気になるところだと思われますので詳細
な情報を次に紹介したいと思います.リサーチトラックは投稿数1416本,採択数
313本,採択率22% ,アプライドデータサイエンストラックは投稿数725本,採択
数184本,採択率25%とのことでした.トピックとしては,グラフとネットワーク
が最大の票田となっており,推薦システム,逐次時系列データがそれに続き,い
ずれもデータマイニングの確固たるトピックとしての存在感がありました.また
,これらに続くトピックとしては時空間データと分類が注目を集めていました.
情報セキュリティや倫理と公平性とプライバシーに関する分野も多くの投稿を集
めており今後も注目のトピックと思われます.
私たちのチームからは,リサーチトラックで1本,アプライドデータサイエンス
トラックで1本の研究が採択されました.1本目は「Causal Effect Estimation
on Hierarchical Spatial Graph Data」と題した論文で,産総研と京都大学の共
同研究の成果です.この研究では,空間の任意の座標で実行される介入が,その
後の結果に与える影響を選択バイアスを持つ空間データから学習するための,階
層空間構造を活用するグラフニューラルネットワークであるSpatial
Intervention Network (SINet)を提案しました.新国立劇場からの数千人規模の
避難をシナリオとして,非常口への経路誘導が避難時間の分布にどのような影響
を与えるかを予測する実験で,SINetは既存のモデルよりも大幅な予測性能の改
善を達成しました.実験ではマルチエージェントシミュレータを用いて作成した
避難者の模擬的な移動データを使用しています.この研究で提案したフレームワ
ークは,グラフ構造を用いて広範な空間データが扱えるため,今後はさらに応用
範囲を拡張する予定です.
2本目は「QTNet: Theory-based Queue Length Prediction for Urban Traffic」
と題した研究で,住友電工システムソリューション株式会社と京都大学の共同研
究の成果です.この研究では,交通工学の知見に基づいて,混雑の変化と道路網
の関係を学習する機能を持つ新たな時空間グラフニューラルネット(QTNet)を
提案しました.警視庁から提供されたデータを用いた,東京都内1098箇所の道路
における「1時間先の渋滞長を予測する実験」で,QTNetは平均して誤差40m以下
という高精度な予測を達成しました.この結果は,現時点で最先端とされる深層
学習手法よりも予測誤差を12.6%も削減することに成功しています.この手法は
警視庁が取り組む AI とビッグデータを活用した交通管制システムの高度化プロ
ジェクトにおいて,住友電工システムソリューション株式会社から警視庁へ納品
されており,交通管制センターで数年内の実用に向けた検証が進められているこ
ともあり,トラックの趣旨とも上手く合致していたのではないかと思います.
来年のKDD 2024は,2024年8月18日から8月22日まで,スペインのバルセロナで開
催されるようです.2025と2026は北米での開催が予定されているようですが,
2027はアジアが候補地となっているようです.今後の情報から目が離せませんね
.
著者紹介:
竹内 孝(京都大学)
2011年早稲田大学大学院先進理工学研究科修士課程修了.2019年京都大学大学院
情報学研究科博士後期課程修了.博士 (情報学).2011年より日本電信電話株式
会社コミュニケーション科学基礎研究所,2020年より京都大学大学院情報学研究
科助教.機械学習の研究と応用,および時空間データ解析に従事.
白上 龍(住友電工システムソリューション株式会社)
2019年京都大学大学院理学研究科修士課程修了.同年,住友電気工業株式会社に
入社.住友電工システムソリューション株式会社にて交通管制システムの開発及
びそこで利用されるAIの研究開発に従事.
西田 遼(産業技術総合研究所)
2023年東北大学大学院情報科学研究科博士後期課程修了.博士(情報科学).同
年,産業技術総合研究所に特別研究員として入所.交通や群集移動を対象とした
エージェントベースのモデリングやシミュレーションおよび機械学習の応用研究
に従事.
------------------------------------------------------------------------
■3■ VLDB 2023 参加報告 山田 浩之(株式会社Scalar)
2023年8月28日から9月1日まで,カナダのバンクーバーにて開催された49th
International Conference on Very Large Data Base(以下 VLDB2023)に参加
しました.VLDBはデータ工学,データベース分野でのトップカンファレンスです
.VLDB 2023は基本は対面で行われ,ビザの影響で対面で参加できない方だけオ
ンラインで発表する形式で開催されました.参加者は全体で1066人で,対面での
参加が96%,オンラインでの参加が4%でした.
VLDB 2023においては,Research Track論文は1074本投稿のうち266本が採録され
,Industry Track論文は75本投稿のうち29本が採録されています.Research
Trackにおける分野別投稿数の上位は,ML, AI, and Databasesで185本,
Database Enginesで144本,Data Mining and Analyticsで128本,Graph and
Network Dataが127本でした.今年のIEEE ICDE 2023にも参加しましたが,ICDE
ではData MiningとGraph分野の投稿数が全体のかなり大きな割合を占めていたの
ですが,VLDBではData Enginesが上位にきていたりと,全体としてデータベース
システムの研究の割合が他のデータベース会議と比較して若干多い印象を受けま
した.国別のResearch Track論文の投稿数ですが,上位から中国本土,米国,ド
イツの順番で,残念ながら日本は10位以内に入っていませんでした.もっと日本
のデータベースの分野を盛り上げて,日本から投稿数を増やさないといけないな
と,気が引き締まりました.
キーノートの一つとして,中国AlibabaのFeifei Li氏から,「Modernization of
Databases in the Cloud Era: Building Databases that Run Like Legos」とい
うタイトルでの発表がありました.Alibabaでは,クラウドデータベースのモダ
ナイゼーションにおいては四つの重要なトレンド(embracing cloud-native
architecture,cloud platform integration/orchestration,co-design for
data fabric,AI-first/AI-inside)がある考えており,彼らのクラウドデータ
ベースであるPolarDBを,その四つのトレンドに対してどう拡張していっている
か,というお話をされていました.かなり情報量が多いプレゼンでしたが,
Alibabaのデータベース分野における研究開発の本気度が伝わってきました.
また,Alibabaは,Industry Trackにおいて,29本のうち7本もの論文を通してお
り,勢いと実行力においても群を抜いていた印象を受けました.
私は,Industry Trackにて「ScalarDB: Universal Transaction Manager for
Polystores」という論文に関する発表をしました.論文では,私が所属する
Scalarというスタートアップで研究開発しているトランザクションマネージャ製
品であるScalarDBにおいて,既存の研究をどのように拡張し,どのような技術的
選択をし,現実世界のプロダクトとして作り上げる上での種々の課題をどう解決
しかたについて論述しています.幸運にも一番大きな会場で,GoogleやAlibaba
と並んで発表できたため,多くの方が聴講してくださり,多くの質問とフィード
バックをもらうことができ,大変有意義な経験をすることができました.
VLDB 2024は,中国の広州で開催される予定です.50回目という記念すべき回で
あり,開催地が日本からも近いこともあるため,ぜひ投稿を検討してみてはいか
がでしょうか.
著者紹介:
山田浩之(株式会社Scalar)
株式会社Scalar CEO兼CTO.データベースミドルウェア製品の研究開発に従事.
博士(情報理工学).
========================================================================
--------------------------------------------------------
株式会社KDDI総合研究所 (KDDI Research, Inc.)
AI部門 量子コンピューティングG
兼 AI部門 統合機械学習G
兼 KDDI株式会社 (KDDI CORPORATION)
技術統括本部 技術戦略本部 技術渉外部 企画G
斉藤 和広 (Kazuhiro Saito)
Address: 〒356-8502
埼玉県ふじみ野市大原2丁目1番15号
TEL: 070-3508-5687
Mail: ku-saitou(a)kddi.com
------------------------------------------------Thanks--
Show replies by date