Archives
All the articles I've archived.
-
WAON: 大規模かつ高品質な日本語画像・テキスト対データセット
本稿では, LLM勉強会で構築した, 大規模かつ高品質な日本語画像・テキスト対データセットのWAONを紹介します.
-
音声言語モデルLlama-Mimiの紹介
本稿では, LLM勉強会で開発した音声言語モデルのLlama-Mimiを紹介します.
-
NAACL2025アルバカーキ参加記
アルバカーキで開催されたNLP国際会議の一つであるNAACL2025の参加記録です。
-
llm-jp-modernbertの紹介
llm-jp-modernbertの紹介
-
基盤モデル研究の最初に読む論文リスト
本稿では基盤モデル研究で最初に読むと良さそうな論文をリストアップします.
-
オープンLLMによる翻訳を活用した日本語CLIPの開発
本稿では, オープンLLMを活用して大規模日本語画像テキスト対データセットを構築し, 日本語CLIPを開発した研究について紹介します.
-
llm-jp-eval-mmの紹介
本稿では, Silviaseさんと共同開発している, llm-jp-eval-mmという, 視覚言語モデルの日本語性能を評価するツールを紹介します.
-
text2dataset: オープンLLMを用いたデータセット翻訳ツールの紹介
本稿では, text2datasetというオープンLLMを用いて英語データセットをもとに日本語翻訳データセットを構築するツールを紹介します.
-
Let's Apply The AI Scientist to the SEIR Model
Let's apply The AI Scientist to the SEIR model, a differential equation-based model used to predict the spread of infectious diseases.
-
Introduction to MinHash
本稿では, 大規模言語モデル用コーパス構築の重複除去において広く用いられているMinHashの基本的なアイデアとアルゴリズム, 比較回数の削減方法について説明します.
-
LLMをゼロから事前学習する
LLMの事前学習の部分を完全理解するべく, LLMをJAXでフルスクラッチで事前学習してみたので, 本稿ではその方法を述べます.
-
Python's Garbage Collection
In this post, we will examine the garbage collection (GC) in CPython. Furthermore, we will also look into the relationship between GC and Global Interpreter Lock (GIL).
-
大阪大学総合図書館の魅力を紹介
本稿では学部時代を通して気付いた大阪大学総合図書館の魅力を紹介します.
-
Neural Tangent Kernel の紹介と実験
本稿では, 学習中のダイナミクスに着目した研究の礎となっている Neural Tangent Kernel (NTK) 理論を紹介する.
-
院試体験記2023
こんにちは, speedです. 猛烈な暑さが続き「最も暑い夏」と言われた2023年の夏, 大学院修士課程を受験しました. 情報系人気も相まって大学院受験に合格することは難しいと考え, 私は複数校受験しました.
-
最適輸送(Optimal Transport)
本稿では, 最適輸送(Optimal Transport)の基本的な考え方と応用例について説明します.
-
OS自作で変わったOSを見る目
本稿では, 自作OSを通じて変わったOSを見る目について述べます.
-
Garbage Collection ~mark & sweep法~
本稿では, ガベージコレクションのアルゴリズムの一つであるmark & sweep法のアルゴリズムを解説します.
-
大学一年生の私に贈る「情報科学の世界」
本書では、stray sheep(迷える子羊)だった大学一年生の私に向けて、どのように情報科学を学ぶのが良いか、ブラウザの仕組みをボトムアップに説明していく過程で各論の良書をリストアップしながら「知の高速道路」を提供します。
-
セキュリティ・キャンプ2022 Bトラック(Webセキュリティ)参加記
この度セキュキャン2022Bトラック(Webセキュリティ)を参加しました.