┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
┃ 日本データベース学会 Newsletter
┃ 2025年8月号 ( Vol. 18, No. 4 )
┗━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
暑中お見舞い申し上げます。梅雨明けとともに本格的な夏を迎えた8月の候、
皆様におかれましてはお変わりなくお過ごしでしょうか。今年は例年以上の
猛暑が予想されておりますが、どうぞお体にお気をつけてお過ごしください。
皆様のご健康とご多幸をお祈り申し上げます。
本号では、国際会議 ICWSM 2025とCVPR 2025の参加報告、NTCIR-18の開催報告を
ご寄稿いただきました。会議の動向やご自身の研究内容など、お楽しみいただけ
れば幸いです。
本号並びに DBSJ Newsletter に対するご意見あるいは次号以降に期待する内容に
ついてご意見がございましたら news-com [at]
dbsj.org までお寄せください。
DBSJ Newsletter 編集委員会
(担当編集委員 廣中 詩織)
========================================================================
----
目次
----
1.ICWSM 2025 参加報告
村山 太一 横浜国立大学
2.CVPR 2025 参加報告
松井 勇佑 東京大学
3.NTCIR-18 開催報告
若宮 翔子 奈良先端科学技術大学院大学
------------------------------------------------------------------------
■1■ ICWSM 2025 参加報告
村山 太一(横浜国立大学)
2025年6月23日から26日にかけて、ICWSM2025 (The 19th International AAAI
Conference on Web and Social Media) がデンマークのコペンハーゲンで開催さ
れました。ICWSMという国際会議はあまり馴染みが無いかもしれないですが、Web
やソーシャルメディア上のデータを活用して社会現象を分析する計算社会科学を
主たるテーマとした研究を中心に発表される国際会議となります。今年の採択論
文数は約140件、参加者は約370名と、他の大規模なAI系会議と比較すると小規模
なものとなっています。国別の参加者比率を見てみると、アメリカが1位、ドイツ
が2位と欧米からの参加者が大半を占める一方、他のAI系会議で高いプレゼンスを
示す中国からの参加者比率は7位でした。日本はどうかというと、参加者比率2%で
10位、筆頭著者の採択論文は4件となっており、まだまだプレゼンスを高める余地
がありそうです。
本会議の大きな特徴として、会期中のすべての口頭発表がシングルトラックで
進行します。これにより、自身の専門分野以外の多様な研究に広く触れることが
できますが、発表者一人あたりの持ち時間は5分と非常に短く、要点を凝縮した
プレゼンテーションが求められます。どんどん規模が大きくなっていく分野とい
うこともあり、さすがに、来年あたりはシングルトラックは無理でしょと思うの
ですが、来年はどうなってるのでしょう?
採択論文のテーマとしては、例年通りHate Speechや政治的分極(Political
Polarization)といった社会課題に関する研究が活発でした。また、「Reddit」
「TikTok」といった具体的なプラットフォーム名を冠したセッションが組まれる
など、個々のメディアの特性を深く掘り下げる研究も目立つ印象です。加えて、
他の国際会議と同様にLLM(大規模言語モデル)の活用も重要なトピックとなって
おり、LLMを用いた社会シミュレーションが現実社会をどの程度反映できるかを
検証する研究や、LLMを活用した新たな教師なしクラスタリング手法の提案など
多くの発表がありました。執筆者が発表した内容もこのカテゴリーに当てはまる
ものとなっています。
学会全体の雰囲気やコペンハーゲンの様子は、同じく併設ワークショップ
(MisD)に参加された同志社大学の寺本さんが執筆された素晴らしい参加報告記
からも伺うことができます。ご興味のある方は、ぜひそちらもご覧ください
(https://www-mil.cis.doshisha.ac.jp/portfolio/icwsm-ws-2025/)。
来年のICWSM2026は、アメリカのロサンゼルスで開催予定です。本会議は少し
独特な査読システムを採用しており、年間を通して3回の投稿締切があります。
一度の査読で採択・不採択が判定される場合もありますが、一部の投稿論文は
「Revision」や「Rebuttal」という形で次の投稿サイクルにて再評価の機会が与
えられます。そして2回目のReviewによって、最終的に採択・不採択が決定され
ます。採択率は現在公開されておりませんが、ラウンド制が採用される3年前ま
では20%前後であり、いわゆる計算社会科学の難関国際会議として位置付けられ
ています。ソーシャルメディア分析や計算社会科学の最新動向を知る上で非常に
有益な会議ですので、興味を持たれた方はぜひ投稿・参加を検討されてはいかが
でしょうか。
著者紹介:
村山太一(横浜国立大学)
2019年に奈良先端科学技術大学院大学博士前期課程修了、2022年に奈良先端科学
技術大学院大学博士後期課程修了。博士(工学)。現在、横浜国立大学 助教。
Web情報工学の研究に従事。
------------------------------------------------------------------------
■2■ CVPR 2025 参加報告
松井 勇佑(東京大学)
【概要】2025/6/11から2025/6/15まで、Computer Vision and Pattern
Recognition (CVPR) がアメリカのナッシュビルにて開催されました。本会議は
Computer Vision (CV) 分野の最難関の会議です。CVPRは過去20年のAI技術の大
進展の中心に位置する会議の1つであり、近年は投稿数が1万件をこえるなど肥
大化が進んでいます。私は本会議に参加し、論文発表を行いました。本記事では
CVPRの雰囲気、最近の潮流から、こまかい面白い点までご紹介できればと思いま
す。時代の中心の会議だからこそ面白い点もあり、不可思議な点もあります。
【今目の前で時代が動いている】CVPRでは論文発表(ポスター・オーラル)、
ワークショップ、チュートリアル、キーノート、など一般的な国際会議の内容に
加え、大規模な企業展示も行われます。そのどれもが最新の技術を紹介するもの
であり、CVPRに参加することで得られる知的な刺激は大きいです。印象深かった
のはキーノートです。Metaの研究者による、オープンなLLMモデル「llama」を
作ったキーノート発表がありました。このllamaを作るという作業は、発表者が
述べていた言葉を借りると「ロケットを打ち上げる」ほど大規模なものだそうで
す。大量の様々な分野の研究者が関係し、それこそロケットを作るような分業や
プロジェクトマネジメントを経てllamaは作られていました。LLMを作ることは大
規模で難しいことは誰でも知るところですが、あらためてそれがロケット産業の
ようなものであると思い知らされたのでした。また、もう一件のキーノートでは
GoogleのGeminiのチームによるembodied AIの研究(ロボットの研究)が紹介さ
れていました。近年のVision Language Model (VLM)の発展に従い、ロボットが
自分で外界を判断し、オペレータからの自然言語入力でロボットを動かすという
技術は信じられないほど発展しています。この分野の進展の早さは驚くべきこと
です。
【技術の移り変わり】また、私はCVPR2023に参加し今年のCVPR2025に二年振りに
参加したのですが、2023のころ大流行していた「NeRF」という三次元復元の技術
に関して、今年はほとんど見ませんでした。この技術の移り変わりの激しさには
圧倒されます。Gaussian Splattingという上位互換のような技術が登場したこと
によりNeRFという単語が衰退したことは確かなのですが、それにしろわずか2年
で「大流行」から「全く見ない」にまで技術流行が変化する流動性はすさまじい
ものです。ベストペーパーに目を向けると、CVPR2025のベストペーパーは
「Visual Geometry Grounded Transformer」というものでした。これは、三次元
復元に関する様々なタスクを、単一のTransformerで解くものです。いわゆる
「ディープでポン」論文の最上位版というものです。CV全般に言えることですが、
複雑なタスクに対しシンプルですがスケーラブルな技術を用い、大量のデータで
取り組む、というここ10年変わっていない基本的な筋を踏襲するものだと感じ
ました。
【日本のプレゼンス】日本のプレゼンスは厳しい状況が続いていますが、日本か
らの投稿数や参加人数は増加しています。参加人数はアメリカ4000人、中国1500
人、韓国580人、が上位3国としてあり、その次のグループにいます(日本・カナ
ダ・ドイツ・イギリスがそれぞれ300人ほど)。フルペーパー中の著者の所属とい
う点でいうと1%ほどで、すなわちCVPRに対する日本のプレゼンスは約1%程度、と
いう印象です。これが多いか少ないかと言うと少ないので頑張らないといけない
のですが、絶対人数としては300人もの日本からの人員がいるということは驚くべ
きことです。私は自分がポスター発表している際に日本の方から日本語で話しか
けられることが多々あり、国際発表で日本語で発表した回数でいうと一番多かっ
たかもしれません。また、オーラル発表ではNTTの武田さんによる
Gromov–Wasserstein問題に関する発表が印象的でした。
【不満】不満としては、Workshop/Tutorialの形態が変わってきてしまっている
ことがあげられます。もともとWorkshopとはある特定の研究分野に興味を持つ
人々が集まってコミュニティを作ったり、よりトピックに特化した論文発表を聞
くことが出来る場でした。しかし、近年のCVPRのWorkshopは多くのプログラムが
有名研究者による招待講演で、そして招待講演者は単純に自分の最新の話をする、
というような状況が増えてきています。また、チュートリアルでも、本来の
チュートリアルは分野を概観できるまとめとしての発表が期待されるものですが、
単純に自分の最新研究を発表するだけ、というものが増えてきています。これら
によって、ワークショップであってもチュートリアルであっても、有名な研究者
が単に自分の最近の研究を発表するだけ、となってしまっているものが多いこと
を感じました。この風潮はちょっと良くないなと感じます。
【細かい点】さて、最後にCVPRの面白い子ネタを紹介します。CVPRは朝食や昼食
が配給されることが多いのですが、特に昔からやけにゆで卵が出されることで有
名でした。なので、一部の研究者の間ではCVPRのといえばゆで卵、というネット
ミーム(?)になっています。今年もその予想通り、ゆで玉子が出ました。ただ、
今年はコーヒーブレイク時にとてもボリュームがあるチーズやハムが大量に出た
りしており、その満足度は高かったです。また、例年CVPRは会場が寒すぎること
で有名(本当?)なのですが、今年もまた部屋内がものすごく寒く、体温調整に
苦労しました。比喩でなく、外は熱くて半袖半ズボンでいいのに、オーラル会場
では分厚いジャケットを着る、という形です。今後CVPRに参加される方は、長袖
の上着をもってくることをお勧めします。
著者紹介:
松井 勇佑(東京大学)
2016年,東京大学大学院情報理工学系研究科電子情報学修了.国立情報学研究所
特任研究員,東京大学生産技術研究所助教を経て,2020年より東京大学大学情報
理工学系研究科講師.コンピュータビジョン,データ構造,機械学習,特にベク
トルデータベースや学習型データ構造など,大規模高速なAIシステムの基盤技術
の研究に従事.博士(情報理工学).
------------------------------------------------------------------------
■3■ NTCIR-18 開催報告
若宮 翔子(奈良先端科学技術大学院大学)
NTCIRプロジェクトでは、情報検索、文書要約、情報抽出、質問応答などを含む、
幅広い情報アクセス技術の研究を促進することを目的として、共同評価の取り組
みを推進しています。第18回目のラウンドにあたるNTCIR-18 では、2024年3月か
ら2025年6月までの約1年半にわたり、10件のシェアードタスクが実施されました。
2025年6月10日から13日にかけて開催されたNTCIR-18 Conferenceでは、各タスク
のオーガナイザーおよび参加者による成果報告が行われました。私は、NTCIR-18
においてProgram Co-Chair、MedNLP-CHATタスクのオーガナイザーおよび参加者
として参画しており、引き続き、NTCIR-19でもProgram Co-ChairおよびMedNLP-Call
タスクのオーガナイザーを務めます。本報告では、NTCIR-18およびNTCIR-18
Conferenceの概要に加え、NTCIR-19の概要についても紹介いたします。
== NTCIR-18 と NTCIR-18 Conference の概要 ==
NTCIR-18 では、以下の計10タスクが開催されました:
- Automatic Evaluation of LLMs (“AEOLLM”)
- The Second Fair Web Task (“FairWeb-2”)
- Temporal Inference of Financial Arguments (“FinArg-2”)
- Hidden Causality Inclusion in Radiology Report Generation (“HIDDEN-RAD”)
- Personal Lifelog Organisation & Retrieval Task (“Lifelog-6”)
- Medical Natural Language Processing for AI Chat (“MedNLP-CHAT”)
- Natural Language Processing for Radiology (“RadNLP”)
- Searching Unseen Sources for Historical Information (“SUSHI”)
- Resource Transfer Based Dense Retrieval (“Transfer-2”)
- Unifying, Understanding, and Utilizing Unstructured Data in Financial Reports (“U4”)
NTCIR-18のタスクは、大規模言語モデル(LLM)の評価、先進的な情報検索(IR)、
ドメイン特化型の自然言語処理(NLP)、そして個人情報や歴史資料情報の管理な
ど、多岐にわたる分野を対象としています。具体的には、AEOLLMはLLMの自動評価
を目的とし、FairWeb-2およびTransfer-2は高度な検索課題に取り組んでいます。
FinArg-2とU4は金融テキストの分析を対象とし、MedNLP-CHAT、HIDDEN-RAD、
RadNLPは医療分野におけるNLPの応用に焦点を当てています。一方で、Lifelog-6
やSUSHIは、それぞれ個人データや歴史情報の管理に関する課題に取り組んでいま
す。これらのタスクは、技術的な革新だけでなく、公平性や社会的影響にも重点
を置いており、NLPおよびIR技術が情報アクセスの多様な側面に応用されているこ
とを示しています。
NTCIR-18は、2024年3月に各タスクの運営が開始され、同年3月29日にキックオフ
イベントが開催され、2025年1月に評価結果が返却されるというスケジュールで
進行しました。日本、インド、中国本土、台湾、韓国、アイルランド、アメリカ
など、アジアを中心とした多様な国や地域から、計113チームがいずれかのタスク
に参加登録し、そのうち67チームが結果を提出しました。NTCIR-18 Conference
では、87本のシステム論文が発表されました。
NTCIR-18 Conferenceでは、各タスクのオーガナイザーによるタスク概要の報告に
加え、Maarten de Rijke教授(アムステルダム大学)およびDouglas W. Oard教授
(メリーランド大学)による基調講演、Ian Soboroff博士(NIST、USA)による
TREC(米国版NTCIR)の報告、さらに、LLMを用いた情報検索評価の新たな可能性
と課題に関するパネルディスカッション、タスクごとのセッションが行われまし
た。会議には196名が参加し、盛況のうちに終了しました。
== NTCIR-19 タスク ==
NTCIR-19は、2025年9月から2026年12月にかけて開催されます。NTCIR-19では以下
の11タスクが実施されます:
- Automatic Evaluation of LLMs 2 ("AEOLLM-2")
- Composed Access to Multimodal E-commerce Objects ("CAMEO")
- Data Analytics for aGRicultural Information ("DAGRI")
- Fact-based Event-centric Human-value Understanding ("FEHU")
- Argument Quality Assessment of Financial Forward-Looking Statements
("FinArg-3")
- Hidden Causal Reasoning in Radiology Report Generation ("HIDDEN-RAD2")
- Personal Lifelog Organization Retrieval Task ("Lifelog-7")
- Medical Natural Language Processing for emergency Call ("MedNLP-CALL")
- RAG Responses Confident and Correct? ("R2C2")
- Multinational, Multilingual, Multi-Industry Regulatory Compliance Checking
("RegCom")
- Cross-modal Claim Verification in Scientific Papers ("SciClaimEval")
さらに、NTCIR-19では追加のタスク募集も行われており、2025年9月3日に開催さ
れるキックオフイベントにて、全てのタスクの概要が紹介される予定です。これ
から研究を始めようとする方、データの準備や評価作業に煩わされることなく手
法の提案に専念したい方、あるいはタスクへの参加を通じて最先端の技術に触れ
たい方など、幅広い皆さまのご参加をお待ちしています。
リンク
NTCIR-18:
https://research.nii.ac.jp/ntcir/ntcir-18/index.html
NTCIR-19:
https://research.nii.ac.jp/ntcir/ntcir-19/index.html
著者紹介:
若宮 翔子(奈良先端科学技術大学院大学)
2013年兵庫県立大学大学院環境人間学研究科博士課程修了。博士(環境人間学)。
2020年より奈良先端科学技術大学院大学先端科学技術研究科准教授。ソーシャル
コンピューティングに関する研究に従事。日本データベース学会、情報処理学会、
人工知能学会、言語処理学会、各会員。
========================================================================
--
廣中 詩織(Shiori Hironaka)
京都大学 学術情報メディアセンター
社会情報解析基盤研究部門 大規模データ活用基盤研究分野
hironaka(a)media.kyoto-u.ac.jp
https://elnikkis.github.io/