Posts
All the articles I've posted.
-
WAON: 大規模かつ高品質な日本語画像・テキスト対データセット
本稿では, LLM勉強会で構築した, 大規模かつ高品質な日本語画像・テキスト対データセットのWAONを紹介します.
-
音声言語モデルLlama-Mimiの紹介
本稿では, LLM勉強会で開発した音声言語モデルのLlama-Mimiを紹介します.
-
NAACL2025アルバカーキ参加記
アルバカーキで開催されたNLP国際会議の一つであるNAACL2025の参加記録です。
-
llm-jp-modernbertの紹介
llm-jp-modernbertの紹介
-
基盤モデル研究の最初に読む論文リスト
本稿では基盤モデル研究で最初に読むと良さそうな論文をリストアップします.
-
オープンLLMによる翻訳を活用した日本語CLIPの開発
本稿では, オープンLLMを活用して大規模日本語画像テキスト対データセットを構築し, 日本語CLIPを開発した研究について紹介します.
-
llm-jp-eval-mmの紹介
本稿では, Silviaseさんと共同開発している, llm-jp-eval-mmという, 視覚言語モデルの日本語性能を評価するツールを紹介します.
-
text2dataset: オープンLLMを用いたデータセット翻訳ツールの紹介
本稿では, text2datasetというオープンLLMを用いて英語データセットをもとに日本語翻訳データセットを構築するツールを紹介します.