
2025.03.15
YouTubeなどの動画共有プラットフォームにおける動画の増加に伴い、動画検索に要する時間が増加している。従来の動画検索エンジンでは、主にキーワードを用いた検索が一般的である。しかし、このキーワード検索では、動画の内容そのものではなく、動画に手動で付与されたキーワードが検索対象となることが中心なため、すべての関連する情報を取得することが難しい。本研究ではこのような課題を解決するため、大規模視覚言語モデル(LVLM)を活用して検索キーワードを自動生成する手法を提案する。
研究成果
- "LLMの反復推論による画像からの検索キーワード抽出", 藤井 悠,飯山 将晃, 情報処理学会全国大会, 7X-02, 2025-03
- 飯山研究室M2の藤井さんとの共著です
