はじめに
マイクロアドは「DEIM2025(第17回データ工学と情報マネジメントに関するフォーラム)」にゴールドスポンサーとして協賛させていただきました。
オンラインでは技術報告の発表を行い、オンサイトではスポンサーブースを出展し、多くの方々と交流することができました。
今回の記事では、その参加レポートをお届けします!
技術登壇
[9A] [9A]連合学習 | DEIM2025 第17回データ工学と情報マネジメントに関するフォーラム | Confit にて「マイクロアドのデータ基盤とその構成について」というテーマで登壇しました。
マイクロアドではオンプレミスでのデータ基盤をHadoopベースで運用していましたが、近年SparkやIcebergをベースとしたデータ基盤に移行を進めています。今回のセッションでは移行に踏み切った背景や移行後に感じているメリットについて紹介しています。
発表資料については以下で公開しているのでご興味ある方は是非ご一読ください!
スポンサーブース
今回は技術登壇と同様に「マイクロアドのデータ基盤とその構成について」をテーマにポスター展示を行いました。
ありがたいことに多くの方にお立ち寄りいただき、データ基盤移行のご紹介やマイクロアドの事業について紹介させていただきました。
ポスターセッション
スポンサーブース運営の合間に、ポスター発表の聴講も行いました。マイクロアドでの実務に活かせそうな研究が数多くありましたが、すべてをご紹介することは難しいため、特に広告会社の視点から興味深いと感じた研究をいくつか取り上げたいと思います。
[6G-03] 大規模言語モデルによるユーザー特性を考慮したクリック予測
大規模言語モデル(ChatGPT)にクリック行動をシミュレーションする際に,ユーザ特性の入力がどのような効果をもたらすかの検証を行った研究です。
アンケートに基づいて作成したユーザ特性とクリックの有無の情報を持った評価データについて,以下の3パターンを評価しています。
- クリックするかをランダムに決定
- ユーザ特性を入力していないLLMでクリックするかを決定
- ユーザ特性を入力したLLMでクリックするかを決定
この中で最も精度が高いのがユーザ特性を入力したLLMであり、ユーザ特性についても特に効果が高い特性とそうでない特性に分かれたということでした。
シンプルな実験ながらも、LLMがユーザ特性を理解し、実際の人間のようにクリックをシミュレーションできることが示唆されていました。我々の課題としてインプレッションまで到達しなかった広告についてはクリックするかどうかが観測できないことがありますが、LLMの活用によって擬似ラベルを作成するといった活用も考えられるところです。
[4F-03] 推薦システムにおけるレビュー数と評価値に基づく人気バイアスの影響調査
推薦システムにおける人気バイアスに関する研究です。”アイテムの人気度” を質と同調性(≒ レビュー数)に分解した上で、同調性を除いてユーザのインタラクションを推定する枠組みであるTIDE(https://doi.org/10.1109/TKDE.2022.3218994)と呼ばれる手法をベースにしています。この研究では、レビュー数と平均評価値に相関があるという分析結果を踏まえて、同調性に加えて「評価値による人気」も切り分けてインタラクションを推定すべきではないかという仮説を立てています。人気度の表現に評価値も組み込んだ実験により、同調性だけでなく評価値も推定から取り除くことで精度が向上することを立証しています。
人気バイアス除去の探索という観点で、面白い切り口、かつ、アプローチでした。マイクロアドでも至る所にバイアスが眠っているため、予稿を深く読みこみながら、関連領域も深堀りしていきたいと強く感じました。
おまけ
天候はあいにくの雨でしたが、博多の食も満喫して大満足の2日間でした。
機械学習エンジニア絶賛採用中
最後に、マイクロアドでは問題設定からサーベイ、開発・運用まで裁量を持ってチャレンジしたい機械学習エンジニアを募集しています。
ご興味あれば是非以下の採用ページからご応募ください!