本号ならびにDBSJ Newsletterに対するご意見あるいは次号以降に期待する内容に
ついてご意見がございましたらnews-com [at]
dbsj.orgまでお寄せください。
DBSJ Newsletter 編集委員会
(担当編集委員 天方 大地)
========================================================================
----
目次
----
1. DEIM2024 開催報告
渡辺 知恵美(筑波技術大学)
2. AAAI2024 参加報告
赤木 康紀(日本電信電話株式会社)
3. IEEE BigComp2024 参加報告
莊司 慶行 (静岡大学)
4. EMNLP2023 参加報告
宮野 稜大(大阪大学)
========================================================================
■1■ DEIM2024 開催報告
渡辺 知恵美(筑波技術大学)
第16回データ工学と情報マネジメントに関するフォーラム
第22回日本データベース学会年次大会(DEIM2024)
https://confit.atlas.jp/guide/event/deim2024主催:日本データベース学会
電子情報通信学会データ工学研究専門委員会
情報処理学会データベースシステム研究会
協力:姫路観光コンベンションビューロー
日程:2024年 2 月 28 日(水)〜 3 月 5 日(火)
会場:オンライン開催(1〜3日目)
アクリエひめじ(4,5日目)
○ 開催概要
データ工学と情報マネジメントに関するフォーラム/日本データベース学会年次大会
(DEIM)は,データ工学と情報マネジメントに関する様々な研究テーマの討論・意見
交換を目的とした研究集会です。2019年〜2022年のオンライン開催を経て、DEIM2023
から直列ハイブリッド開催(最初の3日間に一般発表をオンライン開催、4〜5日目を現
地開催)となりました。DEIM2024も昨年に引き続き直列ハイブリッド形式で開催し、
一般発表420件、参加者800名、そのうちオンサイト参加は約600名と大盛況でした。
○ Day1〜Day3:オンラインでの一般発表
DEIM2023から開催されたマルチトラック制。DEIM2024でも以下の5トラックに分けて
開催いたしました。
Track 1: 自然言語処理・機械学習基礎
Track 2: ビッグデータ基盤技術・データセキュリティ・プライバシ
Track 3: 情報検索・情報推薦・ソーシャルメディア
Track 4: メディア処理・HCI・人間中心情報マネジメント
Track 5: 高度なデータ利活用・ドメイン応用(医療情報,教育,地理情報等)
各トラック並列で2トラックずつ開催し、3日間各トラックで15〜21セッションの一般
発表が開催されました。また各スポンサー企業からも17件の技術報告発表もありました。
発表数が大変多く10セッション並列で開催するため、興味のある発表が並列セッション
で発表されると対面発表では移動が大変でしたが、オンライン開催だとセッション移動
がしやすい利点があります。私の場合は研究室でDEIMに参加している学生たちと同時
視聴し、セッションを聴きつつ補足や議論などをしていました。オンライン開催も慣れ
てきていろんな楽しみ方ができて良いですね。
○ Day4:チュートリアル・ネットワーキング
3日間の一般発表のあと土日を挟んで会場(アクリエひめじ)に集合しました。4日目の
午前と午後最初のセッションはチュートリアル。DEIM2022からチュートリアルセッショ
ンが再開されましたが、超人気・有料コンテンツとして注目されています。DEIM2024で
はLLM関連の4件のチュートリアル(基礎理論と研究動向,実践,ハルシネーション,
LLMベースIR)に加え、連合学習、経済データ分析、高次元データの最近傍探索、
PostgreSQL開発まで幅広いコンテンツで、どのセッションも大盛況でした。今回は特に
学生グループによるチュートリアルもあり講師としての参加の幅がより広がったように思
います。
オープニングでは主催協賛の皆様のご挨拶もさることながら、久々にCFP宣伝コーナー
が復活したのが個人的に感慨深かったです。DEIMで発表しフィードバックを得た研究を
ぜひ案内のあった国際会議や論文誌への投稿につなげて欲しいと思います。
ネットワーキングでは日本データベース学会学生企画「DEIMを羽ばたいた学生の今」
とOpenSpaceTechnology(OST)セッションがありました。学生企画では企業研究者
や起業した方々の話でも大盛り上がり、OSTは参加者同士が悩みや思いを自由に発信
し合う場となりました。日本データベース学会からの軽食提供もあり、遅くまで大変盛
り上がりました。
○ Day5:インタラクティブセッション・DBSJアワー
今年度はインタラクティブ(ポスター)発表が371件と大変多く、初の展示会場による
セッション開催となりました。4日目と5日目と分けて90分のセッションを3回取りまし
たが、その時間では足りないくらいそれぞれ議論が白熱していたようです。また20件の
スポンサーブースも大変盛況でした。DBSJアワーの受賞者講演もオンサイトでは実に6
年ぶりでした。今もなお第一線でイキイキと研究を進めていらっしゃる北川先生と清木
先生のお話が聞け大変刺激を受けました。
○ おわりに
対面での活動が増えたことに加えLLMの台頭と普及でデータ工学分野にとっては激動の
1年だったことを反映したのか、とても刺激的で活発な議論が多いDEIM2024でした。
個人的には直列ハイブリッド形式は、発表・情報収集のオンライン開催、交流・対話・
議論のオンサイト開催とメリハリがあってとても気に入っています。皆様は参加してみ
ていかがだったでしょうか。また来年DEIM2025で皆様、そして新しいワクワクする研
究に出会えることを楽しみにしています。
著者紹介:
渡辺 知恵美(WATANABE, Chiemi )筑波技術大学産業技術大学 准教授
2003年お茶の水女子大学大学院博士後期課程修了. 博士(理学). 奈良女子大学助手,
お茶の水女子大学講師, 産業技術大学院大学准教授, 筑波大学准教授を経たのち2019年
より現職にて個人情報保護技術, 教育データ分析,インクルーシブデザイン, アジャイル
PBLに関する研究及び教育に携わる. 日本データベース学会理事,アジャイルPBL振興
会理事.
------------------------------------------------------------------------
■2■ AAAI2024 参加報告
赤木 康紀(日本電信電話株式会社)
2024/2/20-2024/2/27の日程で,人工知能分野のトップカンファレンスであるAAAI2024
(The 38th Annual AAAI Conference on Artificial Intelligence) が開催されました.
私は採択された論文の発表のため現地参加しましたので、参加報告をさせていただき
ます.
今年はメイントラックには12100件の論文が投稿され,9863件が査読され,2343件が
採択されました(採択率23.75%).
その中で選ばれた120件について口頭発表が行われ,全ての論文についてポスター発
表が行われました.
さらに,Outstanding Paper Awardsが3件の論文に対して授与されました.
採択された論文の分野はコンピュータビジョンが最も多く,機械学習,自然言語処
理と続いており,AI分野の幅広い論文が投稿されていることが見て取れます.
レビューに関する昨年からの変更点として,レビューにおける回答項目及び数値指
標を減らし定性的な評価に重点を置くようにしたこと,主観性を排除するための指
標を追加したこと,予め採択率を決めず基準を超えた論文はほとんど全て採択する
方針に変更したことなどがあるとのことです.
日程は2/20-21がチュートリアル,2/22-25が本会議,2/26-27がワークショップとなっ
ていました.
本会議ではメイントラックの口頭発表セッションとともに,10件程度の招待講演,3
日間にわたるポスター・デモセッションなどが行われました.
口頭発表セッションは会議の規模の割にはパラレル数が少なく,自身の見たい発表を
多く見られるようなプログラムになっていました.
ポスターセッションでは論文の件数が多いこともあってか会場にたくさんの人が集ま
り,白熱した議論が交わされていました.
AAAIはAIに関連していればどんな論文でも受け入れる雰囲気があるため,ポスター
セッションには多種多様なジャンルの発表が集まり,自分が全く知らない分野を発見
することがあります.
ポスターセッションに割り当てられた時間が各日2時間程度しかないため全てを見るこ
とは難しいですが,ふらふらと気になるポスターを探すだけでもとても楽しく有意義
な時間になりました.
ここでは私の印象に残った講演である,Harvard University の Milind Tambe氏による
"ML+Optimization: Driving Social Impact in Public Health and Conservation" について
簡単にご紹介します.
Tambe 氏は機械学習及び数理最適化技術を実社会で活用しインパクトを与える研究を
長年行ってきました.
これらの技術の活用範囲は公衆衛生から環境保全,セキュリティと多岐にわたります.
Tambe 氏の仕事において注目すべきは,理論貢献と実応用での貢献が非常に高いレベ
ルで融合している点です.
Restless bandit, dicision-focused learning, influence maximization などの理論に裏打ち
された手法を,インドにおける母子健康プログラムやロサンゼルスにおける HIV 予防,
カンボジア・ウガンダ・ベリーズにおける環境保全活動などの実フィールドに適用し,
その有効性を確認したプロジェクトが多数紹介されました.
このような研究は,理論ばかりができあがり実応用に結び付けられないものや,理論
に裏打ちされない単なる応用事例にとどまってしまうことも多いと思います.
理論と実応用の両輪を世界規模で進める Tambe 氏の研究には,見習わなければなら
ない部分が非常に多いと感じました.
今回、私が投稿した論文としては "Analytically Tractable Models for Decision Making
under Present Bias", "Optimal Transport with Cyclic Symmetry" の2件が採択されました.
前者は口頭発表に選出されていたため,2/25 の "Machine Learning & Application" セッ
ションで口頭発表を行い,さらに2件ともポスター発表を行いました.
"Analytically Tractable Models for Decision Making under Present Bias" は人間の持つ現
在バイアスに関する論文です.
現在バイアスとは,直近の利得やコストを過大評価してしまう,人間の認知バイアス
の一つであり,長期的な目標達成行動を阻害することが知られています.
本研究では,現在バイアスの影響下の人間の新しい数理モデルを提案しました.
提案モデルは,人間の行動を数学的に閉形式で書き表すことができるという著しい特
長をもっており,その表式に基づき今までは困難だった介入の最適化問題を解くこと
を可能にしています.
"Optimal Transport with Cyclic Symmetry" は最適輸送に関する論文です.
最適輸送とは,与えられた確率分布を別の確率分布に最小コストで輸送する方法を求
める問題であり,機械学習やメディア処理に幅広い応用を持ちます.
本研究では,入力に潜む巡回対称性を利用して最適輸送問題を高速に解く手法を提案
しました.
いずれの発表もポスター発表が盛況で,様々な有用な意見を頂くことができました.
AAAI2025はアメリカのフィラデルフィアで2025/2/27-2025/3/2の日程で開催されます.
AAAIは様々な論文が集まることからAI分野全体を俯瞰するのに適した会議であり,
参加する価値は非常に高いと感じました.
ポスター会場の盛り上がりも必見ですので,ぜひとも現地参加を検討してみて下さい.
著者紹介:
赤木 康紀(日本電信電話株式会社)
日本電信電話株式会社 人間情報研究所 研究主任.
2016年に東京大学大学院情報理工学科数理情報学専攻修士課程を修了.
同年,日本電信電話株式会社に入社.
2023年に社会人博士として筑波大学大学院理工情報生命学術院システム情報工学
研究群情報理工学位プログラム博士後期課程を修了.
数理最適化,数理モデリング,行動モデリング,データマイニングの研究に従事.
------------------------------------------------------------------------
■3■ IEEE BigComp2024 参加報告 莊司 慶行 (静岡大学)
【会議の概要】
2024年2月18日から21日かけてタイのバンコクで開催されたIEEE BigComp 2024に参加
し、発表を行ってきましたので、報告いたします。
BigCompは正式名称を「2024 International Conference on Big Data and Smart
Computing」といい、大規模データを利活用した幅広い情報系トピックを取り扱う国際
会議です。主に、DB、ネットワーク、AI系の研究者が運営しています。
DEIMやWebDBで発表される論文のほとんどは、スコープ内だと思われます。
IEEEと、KIISE(韓国の情報系の有名学会)が共同開催しており、運営にはDBコミュニ
ティでよくお名前を耳にする韓国の先生方が多く参加されています。2019年にはDBSJ協
力のもと京都で開催されたこともあり、なじみ深い会議です。
会議の規模としては、参加者が180名くらいで、発表会場も最大3並列と、大変賑わって
いました。6個のワークショップも併設されるなど、なかなかの規模だと思います。
会議の難易度としては、フルペーパーでの採録が126件中41件(32.5%)と、結構頑張っ
て書かないと通らない採択率になってきています。今年、採録件数が最も多かったのは
韓国の25件で、次いで日本と中国から7件ずつの採録がありました。日本からの投稿数
は11件とのことでした。アジアのDB系応用分野で日本の存在感を示すためにも、もっ
と積極的に投稿するとよいかもしれません。
運営上の心遣いとして、新型コロナ規制の緩和に伴い、参加者間のネットワーキングに
力を入れたとのことでした。毎日のコーヒーブレイクやランチに加えて、クルージング
船でのウェルカムレセプション、会場直結のバンケットなど、参加者間で十分に交流が
取れるように配慮されていました。
【会場の様子】
今年の会場はバンコクのパヤータイ地区の、高級ホテル内での開催でした。会場は快適
で、空港からのアクセスや周辺での買い物のしやすさなども含めて、とても過ごしやす
い環境でした。
開催地区の雰囲気として、現在のバンコクの急激な発展速度は凄まじいものがあり、近
未来的な感じと東南アジアらしさが入り混じっていて、ちぐはぐでサイバーパンクな印
象を受けました。会場から少し歩くと大規模ショッピングモールを床面積そのままに縦
に伸ばしたような超巨大商業施設が乱立しているエリアがあり、きらびやかなビルの中
には海外の有名ブランド店がひしめいています。かと思えば、一歩外に出ると、それら
を結ぶ細かな路地に、自転車で屋台を引いている人がいたり、地べたで露店を広げて果
物などを売り買いしている光景も見られました。
【学会のテーマ】
今回の学会のトピックとして、大規模データ基盤やマイニングアルゴリズムなどの従来
のデータ工学的なトピックに次いで、生成系AIを用いた研究に関するセッションが多く
見られました。生成系AIそのもののセッションもありましたが、画像やNLPに生成AIを
使った研究や、Human-Centered
AIに関するセッションもありました。3件のキーノートもDeepLearningに関係するもの
が多く、超大規模データをいかに現代のAI研究に利用可能にしていくかという課題に、
データインフラや環境の面から切り込んでいく内容のものがありました。人間のため
でなく、AIのためにDB技術を研究する時代が、いよいよやってきたのかもしれません。
ベストペーパーは北京航空航天大学のYuan Renさんらによる研究で、質問応答データ
セットにおけるマルチタスク学習に関する研究でした。
【投稿上のアドバイス】
今年のBigCompでは、幸運にも私の共著論文が3件採録されており、うち2件について
自分で発表してきました。両方とも大規模言語モデルをうまくファインチューニング
して情報検索・情報アクセスの課題に利用する内容で、理論ではなくアプリケーショ
ン寄りの研究です。具体的には、BERTを使ってレビューから映画を検索可能にした
り、GPT-2を使って商品説明から分かりやすい体験的記述を生成する研究でした。こ
れらは応用的でややビッグデータ的ではないテーマでしたが、査読は鋭い指摘もあり
つつ肯定的で、会場の質疑でも建設的なコメントをたくさん頂けました。このように、
この学会では、応用的な事例や工学的な論文でも比較的採録されやすい印象がありま
す。少しトピックからずれているように感じても、恐れずに投稿してみるとよいと思
います。
来年度の開催地はマレーシアのコタキナバル、2月9日から開催予定とのことです。全
体的に、アイデアがはっきりしていて、なおかつ論文がよく書けていれば、評価実験
がそこまで大規模でなくても採録される傾向を感じています。対象となる研究テーマ
の幅も広いので、手ごろな中堅国際会議だと思います。また、学部生や修士学生でも、
十分に採録される可能性がある会議です。例年、締め切りが11月頃ですので、ブラッ
シュアップした卒業論文や、提出直前の修士論文を投稿してみるのもいいかもしれま
せん。積極的なご投稿を検討いただければと思います。
著者紹介:
莊司 慶行 (静岡大学)
2015年京都大学大学院情報学研究科社会情報学専攻博士後期課程修了。博士(情報学)。
京都大学、首都大学東京、青山学院大学での勤務を経て、2023年より静岡大学情報学部
行動情報学科講師。情報アクセス技術やソーシャルコンピューティング分野において、
投稿データを活用したウェブ検索アプリケーションや記憶に残る情報提示法などの研究
に従事。
------------------------------------------------------------------------
■4■ EMNLP2023 参加報告 宮野 稜大(大阪大学)
2023年12月6日から12月10日にかけてEMNLP2023(Empirical Methods in Natural Language
Processing)がシンガポールで行われました.EMNLPは自然言語処理分野のトップカンファ
レンスです.私はワークショップを含む全日程で会議に現地参加しました.今回が初めて
の国際会議への参加でしたが,有意義な時間を過ごすことができました.
今年の投稿数は4,909件と過去最多で,昨年と比較し700件以上増加しています.メインカ
ンファレンスの採択率は21.3%(Long Paper
22%, Short Paper 12%)で,Findingsと合わせた採択率は42.9%(Long Paper 45.4%, Short
Paper 33.5%)でした.トラックごとの投稿数では,応用研究(NLP Applications)が最多で,
大規模言語モデル(Theme Track: LLMs and Future of NLP)が次点でした.
EMNLP2023は現地とオンラインのハイブリッド形式で開催されました.今年は多くの方
が現地参加していましたが,現地参加が難しい場合はオンラインで発表することが可能で
した.また,オンライン参加者もUnderline上で事前に録画された発表内容を確認できるよ
うになっていました.
私はメインカンファレンス初日に「Self-Ensemble of N-best Generation Hypotheses by
Lexically Constrained Decoding」というタイトルでポスター発表を行いました.本論文で
は,言語生成モデルの出力文の品質を改善する手法を提案しています.言語生成では複数
の出力候補を生成し,その内最もスコアの高い候補を出力することが一般的ですが,各候
補には良い箇所と悪い箇所が混在しています.そこで,本研究では各候補の良い箇所を統
合することで高品質な出力を生成することを目指しました.各候補の品質を推定して高品
質な表現を収集し,収集した表現を含むように制御しながら再度生成を行うことで,高品
質な出力文を生成する手法を提案しました.
ポスターセッションは盛況で,90分間のセッションと休憩時間で20名以上の方と議論を行
うことが出来ました.多くの質問とフィードバックをもらうことができ,大変有意義な経
験をすることができました.
次回のEMNLP2024は,アメリカのマイアミで11月12日から11月16日の日程で開催予定で
す.最近は大規模言語モデルを中心に自然言語処理の研究が盛んであるため,次回のEM
NLPも盛況が予想されます.ご興味ある方は参加を検討されてみてはいかがでしょうか.
著者紹介:
宮野稜大 (大阪大学大学院情報科学研究科マルチメディア工学専攻 鬼塚研究室)
大阪大学大学院情報科学研究科修士1年.言語生成に関する研究に従事.
現在は大規模言語モデルのドメイン適応に関する研究に取り組んでいる.
========================================================================