┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2026年6月号 ( Vol. 19, No. 3 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
本号では、国際会議 ICLR2026, EDBT2026, DASFAA2026, EACL2026 の参加報告を
ご寄稿いただいております。会議の動向やご自身の研究内容などのご紹介となり
ます。
本号並びに DBSJ Newsletter に対するご意見あるいは次号以降に期待する内容に
ついてご意見がございましたら news-com [at] dbsj.org までお寄せください。
DBSJ Newsletter 編集委員会
(担当編集委員 村上 直)
========================================================================
----
目次
----
1.ICLR2026 参加報告
藤原 廉(大阪大学産業科学研究所)
2.EDBT2026 参加報告
藤原 靖宏(NTTコミュニケーション科学基礎研究所)
3.DASFAA2026 Report
Tarun Sreepada(東京大学生産技術研究所)
4.EACL2026 参加報告
植田 暢大(NEC ナレッジサイエンス研究所)
========================================================================
■1■ ICLR2026 参加報告
藤原 廉(大阪大学産業科学研究所)
2026年4月23日から27日にかけて、ブラジル・リオデジャネイロにて、機械学
習・深層学習分野のトップカンファレンスである ICLR 2026(The Fourteenth
International Conference on Learning Representations)が開催されました。
ICLR は、表現学習および深層学習を中心に、自然言語処理、コンピュータビジョ
ン、強化学習、ロボティクス、AI for Science など幅広い分野の研究が発表さ
れる主要国際会議です。私は採択論文の発表のため現地参加しました。会議は3
日間の本会議と2日間のワークショップから構成されました。
今年の ICLR では、Maja Matarić 氏、Max Welling 氏、Percy Liang 氏、
Katie Bouman 氏、Karen Adolph 氏、Pablo Arbeláez 氏による6件の招待講演
が行われました。講演内容は、ヒューマンセンタードAIとロボティクス、物理学
とAIの接点、オープンな基盤モデル開発、科学的イメージング、乳幼児の発達と
知能、AI for Open Science など多岐にわたり、ICLR が単なる深層学習アルゴ
リズムの会議にとどまらず、AIを基盤とする幅広い科学技術分野の議論の場へと
拡大していることを強く感じました。個人的には、Percy Liang 氏によるオープ
ンな基盤モデル開発に関する講演と、Max Welling 氏による物理学・材料科学・
AIを接続する講演が特に印象的でした。論文や講義資料を通じて名前を知ってい
た著名な研究者の問題意識を直接聞けることは、国際会議に現地参加する大きな
意義の一つであると改めて感じました。
投稿・採択の規模も非常に大きく、ICLR 2026 には 19,525 件の有効投稿があ
り、最終的に 5,355 件が採択されました。採択率は 27.4% で、会議規模の大き
さと研究競争の激しさがうかがえます。本会議では口頭発表とポスター発表が並
行して行われ、3日間で合計6回のポスターセッションが実施されました。多数の
発表が同時に行われるため全体を追うことは困難でしたが、関心の近い研究者と
直接議論できる機会が多く、研究動向を把握するには非常に密度の高い場でした。
採択論文の傾向としては、大規模言語モデル(LLM)や基盤モデルに関する研究
が引き続き目立っていました。特に、LLMエージェント、推論能力、長文コンテ
キスト、モデル編集、安全性、ベンチマーク、解釈性など、実環境で信頼して利
用するための研究が活発化している印象を受けました。また、ロボティクスや
AI for Science など、応用分野との融合も顕著でした。
最後に、我々の採択論文“When to Retrain after Drift: A Data-Only Test
of Post-Drift Data Size Sufficiency”について簡単に紹介します。本研究で
は、非定常データストリームにおいて、変化を検知した後に「いつ再学習すべき
か」という問題に着目しました。従来のドリフト検知では、主に「いつ分布が変
化したか」を判定することに焦点が当てられてきましたが、実際の運用では、変
化直後のデータがまだ十分でない段階で再学習を行うと、かえって予測性能が不
安定になる場合があります。そこで本研究では、外部のドリフト検知器から変化
アラームが与えられた後、再学習に十分なポストドリフトデータが蓄積されたか
を、モデル非依存かつデータ駆動的に判定する手法を提案しました。ポスター発
表では、非定常時系列、オンライン学習、モデル更新、実環境での予測システム
に関心を持つ研究者と議論することができ、本研究の今後の発展に向けて有益な
フィードバックを得ることができました。
ICLR 2027 は、8年ぶりに米国西海岸で開催される予定とのことですが、詳細
な開催都市・会場は現時点ではまだ発表されていません。ICLR は投稿数・参加
者数ともに急速に拡大しており、深層学習・表現学習のみならず、AIの社会実装、
科学応用など幅広い研究領域において重要な会議となっています。機械学習分野
にご興味のある方は、論文投稿や現地参加を検討されてみてはいかがでしょうか。
著者紹介:
藤原 廉(大阪大学産業科学研究所)
大阪大学産業科学研究所の特任助教.非定常データストリーム,時系列予測,ド
リフト検知に関する研究をしています.2026年に博士号を取得しました.実世界
で変化し続けるデータに対して,機械学習モデルを安定して運用・更新するため
の技術の開発に取り組んでいます.
------------------------------------------------------------------------
■2■ EDBT2026 参加報告
藤原 靖宏(NTTコミュニケーション科学基礎研究所)
2026年3月24日から27日にかけてフィンランド・タンペレ大学にてデータベース
分野の主要国際会議である 29th International Conference on Extending
Database Technology(EDBT 2026) が開催されました。EDBT はクエリ処理や最
適化といったデータベースの中核技術を中心に、ビッグデータ処理基盤、分析手
法、さらには近年の AI 活用までを幅広く扱う、ヨーロッパを中心とした研究コ
ミュニティに強い影響力を持つ国際会議です。
本年は162件の投稿に対して51件が採択され採択率は約31%でした。参加者は279
名でドイツ、フランス、イタリアなど欧州諸国を中心にアメリカ、日本を含む世
界各国から研究者が集まりました。大学だけでなく研究機関や企業研究所からの
参加も多く、データベース技術の実応用を意識した議論が活発に行われていまし
た。
キーノート講演では、データ管理分野の将来像を俯瞰する内容が多く印象的でし
た。Holger Pirk 氏(Imperial College London)は機能追加を重ねた結果とし
て複雑化した従来データベースの問題点を指摘し、部品を組み合わせるように柔
軟で拡張可能なアーキテクチャへの転換を提案しました。またAlon Halevy 氏
(Google Cloud)は生成AIの発展により構造化・非構造化データを統合的に扱え
るようになり、自然言語によるデータ検索や分析パイプライン構築が一般化しつ
つある現状を紹介し、データ管理とAIの融合が今後さらに進むことを示しました。
一般講演全体を通しては理論的新規性だけでなく、手法の詳細な比較・分析やベ
ンチマーク評価を重視する実験中心の論文が多く見られました。Best Paper に
選ばれた provenance sketch のインクリメンタル更新手法や、ブロックチェー
ン実行基盤の高並列化に関する研究など、実システムでの性能改善に直結する研
究が高く評価されていた点はEDBTらしい特徴だと感じました。
私は “Accelerating Graph Construction for MIPS without Search Accuracy
Loss” という題目で発表を行いました。本研究では内積最大探索に用いられる
グラフインデックス構築において、近似表現と計算打ち切りを組み合わせること
で最終的な検索精度を損なうことなく構築時間を大幅に短縮する手法を提案しま
した。発表では精度保証を支える理論的背景について質問を受けるなど関心の高
さを感じるとともに、発表後には既存手法のさらなる精度向上に関する議論も行
うことができました。
一方で国際情勢の影響により一部の研究者が現地参加できずオンライン発表とな
る場面もあり、国際会議の開催環境が世界情勢に大きく左右される現実も実感し
ました。それでもデータベース分野の最新動向と実用を強く意識した研究文化を
直接体感できたことは大きな収穫であり非常に有意義な参加となりました。
次回のEDBTはフランス・リールで開催予定です。データベース分野の最新の研究
動向を把握することができる良い機会なので、ご興味ある方は来年の参加を検討
されてみてはいかがでしょうか。
著者紹介:
藤原 靖宏(NTT株式会社)
2003年早稲田大学大学院理工学研究科電気工学専攻修士課程修了.2011年東京大
学大学院情報理工学系研究科電子情報学専攻博士後期課程修了.博士(情報理工
学).現在、NTTコミュニケーション科学基礎研究所メディア情報研究部メディ
ア認識研究グループリーダ・特別研究員。データ工学、人工知能、機械学習の研
究に従事。日本データベース学会、電子情報通信学会、情報処理学会各会員。
------------------------------------------------------------------------
■3■ DASFAA2026 Report
Tarun Sreepada(東京大学生産技術研究所)
Conference Report: DASFAA 2026
The 31st International Conference on Database Systems for Advanced
Applications
Jeju Island, South Korea: April 27–30, 2026
1. Conference Overview
The 31st International Conference on Database Systems for Advanced
Applications (DASFAA 2026) was held on Jeju Island, South Korea, from
April 27 to April 30, 2026. DASFAA is a leading annual forum in the
Asia-Pacific region for presenting cutting-edge research on database
systems and their applications, bringing together researchers,
developers, and practitioners from academia and industry.
This year, the research track received 834 submissions, of which 228
were accepted as full papers, yielding an acceptance rate of 27.3%.
Notably, 748 of the 834 submissions originated from China, reflecting
the strong engagement of the Chinese research community in this venue.
Proceedings were published by Springer as Lecture Notes in Computer
Science (LNCS).
2. Keynote Addresses
The conference featured three keynote addresses that collectively
highlighted the evolving role of AI, hardware, and graph intelligence in
modern data systems.
Keynote 1: "A Wakeup Call: The SSD Isn't the Bottleneck, We Are" Viktor
Leis, Technical University of Munich (TUM) — Tuesday, April 28
Professor Leis argued that while modern NVMe SSDs have become both
affordable and extremely fast, many database systems fail to exploit
their full potential. The gap between raw device capabilities and
end-to-end throughput is not a hardware problem but a software one:
long-standing abstractions in the database stack have become performance
bottlenecks. Drawing on lessons from the LeanStore project, he outlined
how rethinking the interface between the operating system and the DBMS,
reconsidering core engine architecture, and investing in meticulous
low-level engineering can close this gap. He also discussed how these
lessons extend to the cloud, where disaggregation introduces new
cost-performance trade-offs.
3. Highlights from the Recommendation Systems Sessions
A significant portion of the conference program was devoted to search
and recommendation, spanning six dedicated sessions. A central theme was
the integration of large language models into recommendation pipelines
and the practical challenges this introduces, particularly around
inference latency.
One notable approach, PSAD (Efficient Personalized Reranking with
Semi-Autoregressive Generation and Online Knowledge Distillation),
addressed this latency problem through a two-stage architecture: a
semi-autoregressive teacher model that achieves high-quality ranking
during training, and a lightweight student model that distills the
teacher's knowledge online, enabling real-time inference with minimal
accuracy loss.
Another recurring concern was popularity bias, the tendency of
recommender systems to over-represent popular items at the expense of
niche but relevant content. CDDF (Confidence- and Divergence-Aware
Dual-View Dynamic Fusion) tackled this for long-tail recommendation by
balancing confidence in popular-item predictions with awareness of
underrepresented content. Meanwhile, DTTFD (Mitigating Popularity Bias
for Two-sided Fairness via Dual-Teacher Distillation) approached
fairness from both the user and item sides, using a dual-teacher
distillation framework to produce fairer recommendations without
requiring access to sensitive user attributes.
Several papers also explored reasoning-enhanced recommendation.
CARARec-style approaches aim to emulate the step-by-step reasoning
process that humans use when evaluating items, rather than simply
aggregating interaction histories into a single embedding, a paradigm
shift enabled by chain-of-thought prompting and reinforcement learning
techniques.
4. Awards
10-Year Best Paper Award was presented to G. Sateesh Babu, Peilin Zhao,
and Xiao-Li Li (Institute for Infocomm Research, A*STAR) for their 2016
paper, "Deep Convolutional Neural Network Based Regression Approach for
Estimation of Remaining Useful Life." This paper pioneered the
application of deep convolutional neural networks (CNNs) to predictive
maintenance, adapting filters traditionally used for image recognition
to scan temporal sensor data across multiple channels. By automating
feature extraction from raw sensor signals and simultaneously optimizing
both the feature representations and the remaining-useful-life
predictions through supervised feedback, the approach significantly
outperformed existing methods. The paper has since been cited over 1,300
times and remains highly influential in the prognostics and health
management community.
Best Paper Award went to "DynamicPO: Dynamic Preference Optimization for
Recommendation" by Xingyu Hu et al. (University of Science and
Technology of China / Shanghai Innovation Institute / Meituan).
Best Paper Runner-Up was awarded to "Mitigating Generic Token Dominance
in Cross-Domain Foundation Model for Text-Attributed Graphs" by Heng
Zheng et al.
Best Demo Award was presented to "Investigating Machine Learning Models
for Cardinality Estimation: An Interactive Approach" by Li Rui et al.
(The Chinese University of Hong Kong / Beijing Institute of Technology).
5. Our Paper Presentation
My colleagues and I presented our paper, "Adaptive GPU Compute Resource
Allocation for Efficient High-Utility Itemset Mining", during the Data
Mining and Knowledge Discovery session on Wednesday, April 29.
Our work addresses the computational challenge of high-utility itemset
mining by leveraging GPU parallelism. The core idea is to partition the
mining workload into two categories: large tasks that are well-suited
for parallel execution on the GPU, and small tasks where parallelization
overhead outweighs the benefits. For the large tasks, we employ a
runtime histogram to dynamically determine the optimal GPU block size,
enabling adaptive allocation of compute resources. This approach
achieved approximately two orders of magnitude speedup compared to the
state-of-the-art CPU-based methods.
Our participation at DASFAA provided a valuable opportunity to share
these findings and receive constructive feedback from the broader data
management and mining community. In particular, attendees raised
insightful points about incorporating GPU memory bandwidth
considerations into our data access patterns, a direction we plan to
explore in future work.
6. Concluding Remarks
DASFAA 2026 provided a rich environment for discussion and exchange,
bringing together researchers from diverse backgrounds to explore the
latest advancements in database systems, data mining, and AI-driven data
management. The overarching theme of this year's conference was clear:
databases are no longer passive storage systems but are increasingly
becoming intelligent, adaptive components of AI-driven architectures —
from self-tuning query engines to knowledge structures that underpin
autonomous agents.
We are grateful for the opportunity to present our research on
GPU-accelerated high-utility itemset mining and look forward to
incorporating the feedback we received into future work.
著者紹介:
Tarun Sreepada(東京大学生産技術研究所)
2023年会津大学卒業
2026年会津大学コンピュータ理工学研究科 コンピュータ・情報システム学専攻
CS教育研究領域修了。2026年4月より東京大学大学院博士後期課程に在学中。GPU
並列処理の活用に関する研究開発に従事。
------------------------------------------------------------------------
■4■ EACL2026 参加報告
植田 暢大(NEC ナレッジサイエンス研究所)
2026年3月24日から29日まで、モロッコ・ラバトで開催された EACL 2026 (The
19th Conference of the European Chapter of the Association for
Computational Linguistics) に現地参加し、ポスター発表を行いました。EACL
は ACL の欧州支部が主催する自然言語処理・計算言語学分野の主要国際会議で
あり、今回は EACL として初めてアフリカ大陸で開催された回でもありました。
EACL 2026 では、Main Conference に 445 本、Findings に 355 本の論文が
採択されました。Main Conference の採択率は 20.2%、Findings の採択率は
16.1% であり、ARR を通じた投稿・査読体制のもとで大規模なプログラムが構成
されていました。発表形式としては、Main Conference の対面発表 328 本のう
ち 195 本が oral、133 本が poster であり、Findings の対面発表はすべてポ
スターとして実施されました。ポスターセッションの規模感はちょうどよく、90
分のセッション内で関心の近い発表を見て回りつつ、著者と十分議論ができまし
た。
会議全体としては、大規模言語モデルを前提とした研究が中心でありながら、
単純な性能向上だけでなく、検索拡張生成 (RAG)、Web エージェント、マルチモー
ダル理解、安全性、評価、そして多言語・低資源言語への展開が目立っていまし
た。特にラバト開催という文脈もあり、Arabic NLP、African languages、
low-resource languages に関するワークショップや発表が多く、英語中心のベ
ンチマークだけでは捉えられない言語処理の課題が強く意識されていました。一
方で、タイトルに多く現れていた単語として multilingual、knowledge、
detection、multimodal、agents、safety、vision-language、structured など
があり、従来の NLP タスクの枠を越えて、より応用やシステムに近い方向へ研
究領域が広がっていることを感じました。
私は Findings に採択された “SCAN: Semantic Document Layout Analysis
for Textual and Visual Retrieval-Augmented Generation” という論文を発表
しました。本研究では、図表を含む文書ページの画像をトピック単位で分割する
意味的文書レイアウト解析を提案しています。図表を含む文書を RAG で扱う際、
ページ全体をそのまま視覚言語モデルに入力すると、情報過多により読解の誤り
が生じやすくなります。そこで、必要な文脈を保ったまま入力情報を削減する前
処理として意味的文書レイアウト解析を導入し、RAG ベンチマークにおいて有効
性を示しました。ポスター会場では文書理解・検索系の発表が近い位置に配置さ
れており、発表の合間に他の著者と議論をしたりもできました。
関連する発表では、“SCoPE VLM: Selective Context Processing for
Efficient Document Navigation in Vision-Language Models” が印象に残って
います。これは文書理解をエージェント的に扱う研究です。自身の研究と同様に、
文書や図表を単にモデルへ入力するだけでは不十分であり、必要な情報をどのよ
うに選び、モデルにどのように読ませるかが重要であることを示していました。
また、“WebRollback: Enhancing Web Agents with Explicit Rollback
Mechanisms” のように、Web エージェントが失敗した操作から明示的に手戻り
する能力を扱う研究もあり、現在NECが取り組んでいる Web エージェント研究と
直接つながる話題を多く見つけることができました。
開催地であるラバトは、古い建物が残る旧市街と新しく整備された建物が混在
しており、歴史が感じられる街でした。料理はスパイスの効いたものが多く、食
事の面でもモロッコらしさを感じることができました。ラバト自体は観光都市と
いうより政治の中心地という印象でしたが、鉄道で1時間ほど移動すると周辺の
観光地にもアクセスでき、アフリカ大陸で初めて開催された EACL に現地参加し
たことは記憶に残る経験となりました。
次回の EACL 2027 は、2027年3月9日から14日にギリシャ・アテネで開催予定
です。自然言語処理だけでなく、RAG、情報検索、文書理解、エージェント、構
造化データ処理に関心のある方にとっても、EACL は今後ますます重要な会議に
なると感じました。
著者紹介:
植田 暢大(NEC)
2024年京都大学大学院情報学研究科博士課程研究指導認定退学。同年、日本電気
株式会社(NEC)に入社。博士(情報学)。自然言語処理および文書画像理解の
研究に従事。2021年情報・AI・データ科学博士人材フェローシップ採用。言語
処理学会会員。
========================================================================