Posts
All the articles I've posted.
-
llm-jp-modernbertの紹介
llm-jp-modernbertの紹介
-
基盤モデル研究の最初に読む論文リスト
本稿では基盤モデル研究で最初に読むと良さそうな論文をリストアップします.
-
オープンLLMによる翻訳を活用した日本語CLIPの開発
本稿では, オープンLLMを活用して大規模日本語画像テキスト対データセットを構築し, 日本語CLIPを開発した研究について紹介します.
-
llm-jp-eval-mmの紹介
本稿では, Silviaseさんと共同開発している, llm-jp-eval-mmという, 視覚言語モデルの日本語性能を評価するツールを紹介します.
-
text2dataset: オープンLLMを用いたデータセット翻訳ツールの紹介
本稿では, text2datasetというオープンLLMを用いて英語データセットをもとに日本語翻訳データセットを構築するツールを紹介します.
-
Let's Apply The AI Scientist to the SEIR Model
Let's apply The AI Scientist to the SEIR model, a differential equation-based model used to predict the spread of infectious diseases.
-
Introduction to MinHash
本稿では, 大規模言語モデル用コーパス構築の重複除去において広く用いられているMinHashの基本的なアイデアとアルゴリズム, 比較回数の削減方法について説明します.
-
LLMをゼロから事前学習する
LLMの事前学習の部分を完全理解するべく, LLMをJAXでフルスクラッチで事前学習してみたので, 本稿ではその方法を述べます.