Posts
All the articles I've posted.
-
simple-evals-mmの紹介
本稿では、新たに開発したVLM評価フレームワーク simple-evals-mm を紹介します。
-
JAMMEval:信頼性の高いVLM評価のための日本語ベンチマーク精緻化
本稿では、7つの既存日本語VQAベンチマークを人手で精緻化することで構築したベンチマークコレクションJAMMEvalを紹介します。
-
京都で見つけたおすすめスポットとグルメ
修士課程の2年間を過ごした京都で見つけた、おすすめのスポットやグルメを紹介します。
-
研究に役立つおすすめ資料まとめ
本稿では, 論文執筆・リバッタル・研究発表など, 研究活動に役立つおすすめ資料を紹介します.
-
Terminal-Bench & Harbor の紹介
本稿では, 現在最も重要なベンチマークの一つである Terminal-Bench と, その評価フレームワークである Harbor について解説します.
-
WAON: 大規模かつ高品質な日本語画像・テキスト対データセット
本稿では, LLM勉強会で構築した, 大規模かつ高品質な日本語画像・テキスト対データセットのWAONを紹介します.
-
音声言語モデルLlama-Mimiの紹介
本稿では, LLM勉強会で開発した音声言語モデルのLlama-Mimiを紹介します.
-
NAACL2025アルバカーキ参加記
アルバカーキで開催されたNLP国際会議の一つであるNAACL2025の参加記録です。